丁寧に伝えないとわからない音声認識
https://www.youtube.com/watch?v=2rPsAVKUGak
2000年〜2010年の音声認識よりも、遥かに使いやすくなった音声認識。
2003,4年くらいは 1GHz のデスクトップPCで連続音声認識をやっとできていたレベルだけど。今や、Hey Siri を余裕でこなす。
ただ話している言葉を分解して、意味を理解する必要があるので。人が話す言葉の量は多くなる。
「Hey Siri, 80年代の曲をかけて、よりも、もっと簡単に。」
コンテキストを捉えて
あれ、それ、でわかるのが人間
人の過去を理解したり、そのときの状況を人はなんとなく捉えている。
「80年代」
といったら、その人にとっては音楽かもしれないし、アートかもしれないし、ファッションかもしれない。
その人のコンテキストと、言葉を組み合わせると、ラクな音声認識ができるんじゃないかと考えている。
(Visited 199 times, 1 visits today)