
155
5.14
データセットを一から構築する
トを呼び出さずに済ませることができる。
5.14
データセットを一から構築する
2
章では、
VUI
が認識するユーザー入力のモデル構築について簡単に考察した。と
きには、何もないところから自分自身の知識と経験に基づいて一から作らなくてはな
らないこともある。
可能な限り、初期モデルと重要なフレーズは自力で開発することをおすすめする。
このために役立つ情報源がいくつかある。
ウェブサイトのデータ
もし既存のウェブサイトに、あなたの
VUI
アプリに関連するリソースがすでに存
在しているなら、ユーザーがあなたの製品やサービスを参照するときに使う用語は、
すでに存在していることになる。これは絶好の条件だといってよい。
FAQ
でも、カ
スタマーサービスのサポート用フォームでも、現在ウェブを通じて企業とのやりとり
に使っているものであれば何でもよい。企業がチャットボットを持っているなら、そ
の発言を書き起こしたテキストでもよい。
コールセンターのデータ
IVR
の世界では、コールセンターからデータを取得することは一般的であり、そこ
には質問や問題を抱えたユーザーが電話をかけてくる。コールセンターの電話対応係
は知識の宝庫だ。顧客が本当に困っている問題を知っている。
データ収集
上記のふたつの情報源がどちらも手に入らない場合も多い。おそらくあなたは、まっ
たく新しくて代替チャンネルのないものを作っているのだろう。この場合(他の情報
源がある場合であっても)、データセット構築の最適な第一歩 ...