丁寧に伝えないとわからない音声認識

https://www.youtube.com/watch?v=2rPsAVKUGak

2000年〜2010年の音声認識よりも、遥かに使いやすくなった音声認識。

2003,4年くらいは 1GHz のデスクトップPCで連続音声認識をやっとできていたレベルだけど。今や、Hey Siri を余裕でこなす。

ただ話している言葉を分解して、意味を理解する必要があるので。人が話す言葉の量は多くなる。

「Hey Siri, 80年代の曲をかけて、よりも、もっと簡単に。」

コンテキストを捉えて

あれ、それ、でわかるのが人間

人の過去を理解したり、そのときの状況を人はなんとなく捉えている。

「80年代」

といったら、その人にとっては音楽かもしれないし、アートかもしれないし、ファッションかもしれない。

その人のコンテキストと、言葉を組み合わせると、ラクな音声認識ができるんじゃないかと考えている。

(Visited 71 times, 1 visits today)

投稿者: Kentaro Yamamoto

Founder of Nain Inc. 株式会社ネインの代表です。何かしナガラでも情報とツナガルことで、情報の流れを変え、時の流れを変えます。移動しながら、ニュース、天気、メッセージを聴き、返信できるスマートイヤフォン『APlay』を開発しています。