
4.2
バージイン
108
Wikipedia
には、音声認識ソフトウェアの詳しいリストが載っている(
https://
en.wikipedia.org/wiki/List_of_speech_recognition_software
)。
複数の音声認識エンジンを提供している会社もある。たとえば
Nuance
は、医療ア
プリや口述筆記など、用途に応じて異なる
ASR
ツールを用意している。音声認識エ
ンジンを選ぶ際に注意すべき重要なポイントはふたつある。
・データセットと精度の堅牢性
・終端検出の性能
音声認識市場に新規参入しようとする企業はしばしば苦戦を強いられる
―
技術は
優れているかもしれないが、大企業が長年かかって集めたデータを持っていない。そ
のため、適用分野によっては、認識性能が思ったほど良くならない。
時として技術者は、音声認識の精度に注力するあまり、もうひとつの重要な要件を
忘れることがある。それは優れた終端検出技術だ。終端検出とは、人がいつ話し始め、
いつ話し終えたのかをコンピューターが知るということを難しく表現した用語だ。終
端(あるいは発話の終わり)検出の優れた音声認識エンジンを選ぶことは成否を左右
する重要な問題だ。本章の少しあとに詳しく説明する。
システムをデザインする際、最低価格のツールを使いたい誘惑にかられることがあ
るだろうが、注意が必要だ。認識精度が低かったり、終端検出が雑だったりするとユー
ザー体験は著しく損なわれる。「かなりよくできた」認識なら十分だと思うかもしれ
ないが、ユーザーはすぐに ...