
113
4.2
バージイン
4.2.2
終端検出のタイムアウト
前にも述べたように、優れた
VUI
体験にとって最も重要なもののひとつが優れた
終端検出だ。終端検出とはユーザーがいつ話し終わったかをシステムが検出するとい
う意味だ(会話で話者のターンが終わったときを検出することともいえる)。
音声認識エンジンの中には、終端検出タイムアウトと呼ばれるものを設定すること
で、終端検出を調整できるものかある。終端検出タイムアウトとは、ユーザーの音声
が途切れてから、システムがユーザーは話し終えたと判断するまでの時間を指す。
どの音声認識エンジンでも終端検出タイムアウトを設定できるわけではないが、デ
フォルト値が何秒かを知っておくと役に立つ。
1.5
秒間の空白は、
VUI
のほとんどの
応答に適用できる目安だ。短すぎると、ユーザーが話し終わる前に途切れてしまう。
長すぎるとユーザーは自分の言ったことをシステムが聞いたかどうか不安になる。
このタイムアウトの調整を利用したくなる場面がいくつかある。使い勝手の良い
VUI
システムのほとんどが、状態に応じて異なるタイムアウト値を設定できるよう
柔軟に作られている。たとえば、ユーザーから始めた会話(「
OK Google
」と言った
り
iPhone
のボタンを押して
Siri
を起動した場合)のタイムアウトは、システムが発
話した「お元気ですか?」に対する応答のタイムアウトより短くする必要がある。ユー
ザーから会話を始めた場合は、イベントを開始したのはシステムではなくユーザー自
身なので、ユーザーは ...