book

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

Name: デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則
ISBN: 9784873118581

by Cathy Pearl, 川本大功, 高橋信夫

November 2018

Beginner to intermediate

304 pages

6h 11m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

1.1.2 なぜVUI なのか？
1.2 会話型ユーザーインターフェース
1.2.1 Alexa をインタビューする
1.3 VUI デザイナーとは何か？
1.4 チャットボット
1.5 結論
2章 VUIデザイン原理の基本
2.1 モバイルデバイス向けVUI デザインとIVR システム向けVUI デザイン
2.2 会話型デザイン
2.3 ユーザーに期待している行動を促す
2.4 デザインツール
2.4.1 対話サンプル
2.4.2 ビジュアル・モックアップ
2.4.3 フロー
2.4.4 プロトタイピングツール
2.5 確認
2.5.1 【方法1】3 段階の信頼度
2.5.2 【方法2】暗黙の確認
2.5.3 【方法3】沈黙による確認
2.5.4 【方法4】汎用的確認
2.5.5 【方法5】ビジュアルな確認
2.6 コマンド制御型 vs 会話型
2.6.1 コマンド制御方式
2.6.2 会話方式
2.7 会話マーカー
2.8 エラーハンドリング
2.8.1 音声が検出されなかった
2.8.2 音声は検出されたが何も認識できなかった
2.8.3 認識されたが処理できなかった
2.8.4 認識したが誤っていた
2.8.5 プロンプトをエスカレーションする
2.9 ユーザーを責めるな
2.10 ユーザーの習熟度
2.11 コンテキストを維持する以前の、Google がエイブラハム・リンカーン
2.12 ヘルプおよびその他のユニバーサルコマンド
2.13 遅延
2.14 曖昧さの回避
2.15 デザイン・ドキュメント
2.15.1 プロンプト
2.15.2 文法、キーフレーズ
2.16 アクセシビリティー
2.16.1 インタラクションは時間効率をよくすべきだ
2.16.2 手短に
2.16.3 早く話す！
2.16.4 いつでも割り込める
2.16.5 コンテキストを提示する
2.16.6 ユーザーが迷子にならないために
2.16.7 音声合成のパーソナル化
その他のタイプのアクセシビリティー
2.17 結論
3章ペルソナとビジュアルVUI
3.1 ペルソナ
3.2 VUI は姿を見せるべきか？
3.3 アバターを使ううえでやってはいけないこと
3.4 アバター（またはビデオ）を使ううえですべきこと
3.4.1 ストーリーテリング
3.4.2 チームワーク
3.4.3 ビデオゲーム
3.5 VUI でいつビデオを使うべきか
3.6 ビジュアルVUI のベストプラクティス
3.6.1 ユーザーは自分の顔を見るべきか？
3.6.2 GUI の扱い
3.6.3 エラーハンドリング
3.6.4 ターンの交代とバージイン
3.6.5 ユーザーとのエンゲージメントと認識のイリュージョン
3.7 アバターを使わないビジュアルフィードバック
3.8 声を選ぶ
3.9 アバターの利点
3.10 アバターの欠点
3.10.1 不気味の谷
3.11 結論
4章音声認識技術
4.1 音声認識エンジンの選択
4.2 バージイン
4.2.1 タイムアウト
4.2.2 終端検出のタイムアウト
4.2.3 無音タイムアウト
4.2.4 話が長すぎる
4.3 N-best リスト
4.4 音声認識の課題
4.4.1 ノイズ
4.4.2 複数話者
4.4.3 子供
4.4.4 名前とスペリングと英数字
4.5 データプライバシー
4.6 結論
5章高度なVUIデザイン
5.1 音声入力に応じた分岐
5.1.1 制約のある応答
5.1.2 オープンスピーチ
5.1.3 入力のカテゴリー分け
5.1.4 ワイルドカードと論理的表現
5.2 曖昧さ
5.2.1 情報不足
5.2.2 ひとつの情報しか想定していないときにふたつ以上の情報
5.3 否定の扱い
5.4 意図と目的を捉える
5.5 ダイアログマネジメント
5.6 ユーザーを宙ぶらりんにしない
5.7 VUI は認識したことを表示すべきか？
5.8 感情分析と感情検出
5.9 音声合成 vs 事前録音
5.10 話者認証
5.11 ウェイクワード
5.12 コンテキスト
5.13 高度なマルチモーダル
5.14 データセットを一から構築する
5.15 高度な自然言語理解
5.16 結論
6章 VUIのユーザーテスト
6.1 VUI 固有の注意点
6.2 ユーザーとユースケースの背景調査
6.3 実際のユーザーと一緒にテストを計画する (1/2)
6.3 実際のユーザーと一緒にテストを計画する (2/2)
6.4 初期段階でのユーザーテスト (1/2)
6.4 初期段階でのユーザーテスト (2/2)
6.5 ユーザビリティーテスト (1/2)
6.5 ユーザビリティーテスト (2/2)
6.6 測定基準
6.7 次のステップ
6.8 車載、デバイス、ロボットのVUIシステムをテストする
6.9 結論
7章 VUI 完成後にすべきこと
7.1 リリース前のテスト
7.2 性能を測定する (1/2)
7.2 性能を測定する (2/2)
7.3 ログを残す
7.4 文字起こし
7.5 段階的リリース
7.6 アンケート
7.7 分析
7.8 ツール
7.9 結論
8章音声対応デバイスと自動車
8.1 デバイス
画面のないデバイスのためのデザイン (1/2)
画面のないデバイスのためのデザイン (2/2)
8.2 自動車と自動運転車 (1/3)
8.2 自動車と自動運転車 (2/3)
8.2 自動車と自動運転車 (3/3)
8.3 結論
エピローグ
付録本書で取り上げた製品
日本版特別寄稿1 サービスから考えるVUIのデザイン
1.1 VUI とサービス
1.1.1 サービスの中でのVUI の位置付け
1.2 VUI デザイン
1.2.1 会話のゴール／ユーザーの意図
1.2.2 VUI のキャラクターのデザイン
1.2.3 会話の始め方と終わり方、そして中断
1.2.4 ユーザーに学んでもらう仕掛け
1.3 まとめ
日本版特別寄稿2 コミュニケーションロボットから学ぶVUI/UX
2.1 スマートスピーカーの登場
2.2 VUI/UX におけるコミュニケーションロボットという流れ
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (1/2)
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (2/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (1/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (2/2)
監訳者あとがき
索引 (1/2)
索引 (2/2)

Content preview from デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

113

4.2

バージイン

4.2.2

終端検出のタイムアウト

前にも述べたように、優れた

VUI

体験にとって最も重要なもののひとつが優れた

終端検出だ。終端検出とはユーザーがいつ話し終わったかをシステムが検出するとい

う意味だ（会話で話者のターンが終わったときを検出することともいえる）。

音声認識エンジンの中には、終端検出タイムアウトと呼ばれるものを設定すること

で、終端検出を調整できるものかある。終端検出タイムアウトとは、ユーザーの音声

が途切れてから、システムがユーザーは話し終えたと判断するまでの時間を指す。

どの音声認識エンジンでも終端検出タイムアウトを設定できるわけではないが、デ

フォルト値が何秒かを知っておくと役に立つ。

1.5

秒間の空白は、

VUI

のほとんどの

応答に適用できる目安だ。短すぎると、ユーザーが話し終わる前に途切れてしまう。

長すぎるとユーザーは自分の言ったことをシステムが聞いたかどうか不安になる。

このタイムアウトの調整を利用したくなる場面がいくつかある。使い勝手の良い

VUI

システムのほとんどが、状態に応じて異なるタイムアウト値を設定できるよう

柔軟に作られている。たとえば、ユーザーから始めた会話（「

OK Google

」と言った

り

iPhone

のボタンを押して

Siri

を起動した場合）のタイムアウトは、システムが発

話した「お元気ですか？」に対する応答のタイムアウトより短くする必要がある。ユー

ザーから会話を始めた場合は、イベントを開始したのはシステムではなくユーザー自

身なので、ユーザーは ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9784873118581Other

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

by Cathy Pearl, 川本大功, 高橋信夫

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

デザインスプリント ―プロダクトを成功に導く短期集中実践ガイド

情報アーキテクチャ第4版 ―見つけやすく理解しやすい情報設計

Publisher Resources