
7.4
文字起こし
206
情報は会話の各ターンのあとに記録するのがよい。ユーザーが突然やめてしまった
り、アプリがクラッシュしたりするかもしれないからだ。ユーザーが優雅な結論に至
るようなベストケースのシナリオだけを記録していると、データの重要な部分を失う
ことになる。
言うまでもないことだが、音声データは匿名化したうえで、分析以外の目的に使用
してはならない。
7.4
文字起こし
システムの性能を正確に分析するためには、もうひとつ重要な作業が必要だ。それ
はユーザーが
VUI
に話した音声を人間が聞き 、( 手で)文字起こしすることである。
「でも待ってくれ」とあなたは言うかもしれない。「今の音声認識の精度は
92
%だと
いうじゃないか!
私は文字起こしを自動で行いたい。その方がずっと安い 」。
確かに、多くのケースで音声認識結果は非常に正確だ。しかし、そうでない場合も
多い。ユーザーが実際に話した会話を使ってデータセットを作ったり改善したりする
場合、誤ったデータを使ってしまうと成功することは困難になる。
Balentine
と
Morgan
が言うように、「音声認識の性能を判定する唯一正確な方法は、個々の発話
のログを残して、オフラインで文字起こしすることだ」。
*5
文字起こしの費用は高いが、少なくとも一部でもデータを文字起こししなければ、
良い
VUI
を作ることはできない。文字起こしを専門にしている会社には、この分野
で経験豊富な
Appen
などがあり、他にもこのサービスを提供している小さな会社が
たくさんある。 ...