book

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

Name: デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則
ISBN: 9784873118581

by Cathy Pearl, 川本大功, 高橋信夫

November 2018

Beginner to intermediate

304 pages

6h 11m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

1.1.2 なぜVUI なのか？
1.2 会話型ユーザーインターフェース
1.2.1 Alexa をインタビューする
1.3 VUI デザイナーとは何か？
1.4 チャットボット
1.5 結論
2章 VUIデザイン原理の基本
2.1 モバイルデバイス向けVUI デザインとIVR システム向けVUI デザイン
2.2 会話型デザイン
2.3 ユーザーに期待している行動を促す
2.4 デザインツール
2.4.1 対話サンプル
2.4.2 ビジュアル・モックアップ
2.4.3 フロー
2.4.4 プロトタイピングツール
2.5 確認
2.5.1 【方法1】3 段階の信頼度
2.5.2 【方法2】暗黙の確認
2.5.3 【方法3】沈黙による確認
2.5.4 【方法4】汎用的確認
2.5.5 【方法5】ビジュアルな確認
2.6 コマンド制御型 vs 会話型
2.6.1 コマンド制御方式
2.6.2 会話方式
2.7 会話マーカー
2.8 エラーハンドリング
2.8.1 音声が検出されなかった
2.8.2 音声は検出されたが何も認識できなかった
2.8.3 認識されたが処理できなかった
2.8.4 認識したが誤っていた
2.8.5 プロンプトをエスカレーションする
2.9 ユーザーを責めるな
2.10 ユーザーの習熟度
2.11 コンテキストを維持する以前の、Google がエイブラハム・リンカーン
2.12 ヘルプおよびその他のユニバーサルコマンド
2.13 遅延
2.14 曖昧さの回避
2.15 デザイン・ドキュメント
2.15.1 プロンプト
2.15.2 文法、キーフレーズ
2.16 アクセシビリティー
2.16.1 インタラクションは時間効率をよくすべきだ
2.16.2 手短に
2.16.3 早く話す！
2.16.4 いつでも割り込める
2.16.5 コンテキストを提示する
2.16.6 ユーザーが迷子にならないために
2.16.7 音声合成のパーソナル化
その他のタイプのアクセシビリティー
2.17 結論
3章ペルソナとビジュアルVUI
3.1 ペルソナ
3.2 VUI は姿を見せるべきか？
3.3 アバターを使ううえでやってはいけないこと
3.4 アバター（またはビデオ）を使ううえですべきこと
3.4.1 ストーリーテリング
3.4.2 チームワーク
3.4.3 ビデオゲーム
3.5 VUI でいつビデオを使うべきか
3.6 ビジュアルVUI のベストプラクティス
3.6.1 ユーザーは自分の顔を見るべきか？
3.6.2 GUI の扱い
3.6.3 エラーハンドリング
3.6.4 ターンの交代とバージイン
3.6.5 ユーザーとのエンゲージメントと認識のイリュージョン
3.7 アバターを使わないビジュアルフィードバック
3.8 声を選ぶ
3.9 アバターの利点
3.10 アバターの欠点
3.10.1 不気味の谷
3.11 結論
4章音声認識技術
4.1 音声認識エンジンの選択
4.2 バージイン
4.2.1 タイムアウト
4.2.2 終端検出のタイムアウト
4.2.3 無音タイムアウト
4.2.4 話が長すぎる
4.3 N-best リスト
4.4 音声認識の課題
4.4.1 ノイズ
4.4.2 複数話者
4.4.3 子供
4.4.4 名前とスペリングと英数字
4.5 データプライバシー
4.6 結論
5章高度なVUIデザイン
5.1 音声入力に応じた分岐
5.1.1 制約のある応答
5.1.2 オープンスピーチ
5.1.3 入力のカテゴリー分け
5.1.4 ワイルドカードと論理的表現
5.2 曖昧さ
5.2.1 情報不足
5.2.2 ひとつの情報しか想定していないときにふたつ以上の情報
5.3 否定の扱い
5.4 意図と目的を捉える
5.5 ダイアログマネジメント
5.6 ユーザーを宙ぶらりんにしない
5.7 VUI は認識したことを表示すべきか？
5.8 感情分析と感情検出
5.9 音声合成 vs 事前録音
5.10 話者認証
5.11 ウェイクワード
5.12 コンテキスト
5.13 高度なマルチモーダル
5.14 データセットを一から構築する
5.15 高度な自然言語理解
5.16 結論
6章 VUIのユーザーテスト
6.1 VUI 固有の注意点
6.2 ユーザーとユースケースの背景調査
6.3 実際のユーザーと一緒にテストを計画する (1/2)
6.3 実際のユーザーと一緒にテストを計画する (2/2)
6.4 初期段階でのユーザーテスト (1/2)
6.4 初期段階でのユーザーテスト (2/2)
6.5 ユーザビリティーテスト (1/2)
6.5 ユーザビリティーテスト (2/2)
6.6 測定基準
6.7 次のステップ
6.8 車載、デバイス、ロボットのVUIシステムをテストする
6.9 結論
7章 VUI 完成後にすべきこと
7.1 リリース前のテスト
7.2 性能を測定する (1/2)
7.2 性能を測定する (2/2)
7.3 ログを残す
7.4 文字起こし
7.5 段階的リリース
7.6 アンケート
7.7 分析
7.8 ツール
7.9 結論
8章音声対応デバイスと自動車
8.1 デバイス
画面のないデバイスのためのデザイン (1/2)
画面のないデバイスのためのデザイン (2/2)
8.2 自動車と自動運転車 (1/3)
8.2 自動車と自動運転車 (2/3)
8.2 自動車と自動運転車 (3/3)
8.3 結論
エピローグ
付録本書で取り上げた製品
日本版特別寄稿1 サービスから考えるVUIのデザイン
1.1 VUI とサービス
1.1.1 サービスの中でのVUI の位置付け
1.2 VUI デザイン
1.2.1 会話のゴール／ユーザーの意図
1.2.2 VUI のキャラクターのデザイン
1.2.3 会話の始め方と終わり方、そして中断
1.2.4 ユーザーに学んでもらう仕掛け
1.3 まとめ
日本版特別寄稿2 コミュニケーションロボットから学ぶVUI/UX
2.1 スマートスピーカーの登場
2.2 VUI/UX におけるコミュニケーションロボットという流れ
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (1/2)
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (2/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (1/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (2/2)
監訳者あとがき
索引 (1/2)
索引 (2/2)

Content preview from デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

5.1

音声入力に応じた分岐

130

入れるといった既存の物理的手段と比べて、ボイスシステムは面倒で時間のかかるも

のになってしまう。

新しい技術が既存ツールを有効に置き換えるためには、仕事が速くかつ簡単になら

なくてはならない。短時間の作業では、音声検出のエラーが起きるとそれが不可能に

なる

。

これまで検討してきたことの大部分は

VUI

の音声認識部分に関連するものであり、

自然言語理解（

NLU

：

natural-language understanding

）ではない。音声認識の結果

とは、認識エンジンが返す単語列のことであり、その返ってきた単語列を

NLU

が解

釈する。現在では音声認識の精度が向上した結果、優れた

VUI

を作ることの難しさ

は技術そのものよりも

NLU

、すなわち入力データをどう扱うかにある。

それではまず、

VUI

が入力に対して応答するさまざまな方法を見てみよう。

5.1

音声入力に応じた分岐

本書ではこれまで、有効な音声入力が複数ある場合の扱いについて、あまり時間を

割いてこなかった。入力はどれも同じではない。ユーザーが何と言うと予測するか、

それをどう扱うかは、ターンごとに異なる。

ここでは基本となる応答から始め、そこから先へ進むことにする。

5.1.1

制約のある応答

システムはときとして非常に基本的な質問をする。たとえば、「フライトの予約を

しますか？」とか「好きな色は何ですか？」などだ。この種の質問に対する応答は非

常に制約されている。前者の場合、「はい」か「いいえ」の変化形に注目していれば ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9784873118581Other

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

by Cathy Pearl, 川本大功, 高橋信夫

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

デザインスプリント ―プロダクトを成功に導く短期集中実践ガイド

情報アーキテクチャ第4版 ―見つけやすく理解しやすい情報設計

Publisher Resources