
4.4
音声認識の課題
122
4.4
音声認識の課題
ここまで、音声認識エンジンの持つ最高の機能を活用する方法について話してきた。
今度は、テクノロジーがまだそこまで追いついていない場面についても話さなくては
ならない。データによっては
ASR
の精度は
90
%とされているが、それは理想的な条
件下での数字であることを忘れてはならない。理想的な条件とは、成人男性が静かな
部屋で高性能マイクロホンを使うという意味だ。
そして、実際の環境ではそうはいかない……。
このセクションでは
VUI
のデザインに独特な課題を取り上げる。その多くは、
VUI
デザイナーにとって制御不能である。テクノロジーが改良されるのを待つこと
以外にすべき仕事は、今どんな課題が存在しているかを知り、そのうえで現段階でで
きる最高のデザインをすることだ。
4.4.1
ノイズ
ASR
ツールにとって最大の課題はノイズ(雑音)の処理だ。たとえば、高速道路
を走っているときや、混雑したレストランにいるとき、あるいは水飲み場の近くで聞
こえるような連続ノイズ。また、ユーザーが話したそのときに起こるノイズもある。
犬が吠えたり、キッチンで料理をしているときに熱したフライパンに野菜を入れたり
する音などだ。
他にも、アプリが聞き取っているときにユーザーが友達や同僚と話すことや、背後
に流れるテレビの音、複数の人が同時に話すことなどの課題がある。
先ほど言ったように、こうした課題に関して
VUI
デザイナーとしてできることは
あまりない。成しうる最善の努力は、ユーザーは ...