book

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

Name: デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則
ISBN: 9784873118581

by Cathy Pearl, 川本大功, 高橋信夫

November 2018

Beginner to intermediate

304 pages

6h 11m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

1.1.2 なぜVUI なのか？
1.2 会話型ユーザーインターフェース
1.2.1 Alexa をインタビューする
1.3 VUI デザイナーとは何か？
1.4 チャットボット
1.5 結論
2章 VUIデザイン原理の基本
2.1 モバイルデバイス向けVUI デザインとIVR システム向けVUI デザイン
2.2 会話型デザイン
2.3 ユーザーに期待している行動を促す
2.4 デザインツール
2.4.1 対話サンプル
2.4.2 ビジュアル・モックアップ
2.4.3 フロー
2.4.4 プロトタイピングツール
2.5 確認
2.5.1 【方法1】3 段階の信頼度
2.5.2 【方法2】暗黙の確認
2.5.3 【方法3】沈黙による確認
2.5.4 【方法4】汎用的確認
2.5.5 【方法5】ビジュアルな確認
2.6 コマンド制御型 vs 会話型
2.6.1 コマンド制御方式
2.6.2 会話方式
2.7 会話マーカー
2.8 エラーハンドリング
2.8.1 音声が検出されなかった
2.8.2 音声は検出されたが何も認識できなかった
2.8.3 認識されたが処理できなかった
2.8.4 認識したが誤っていた
2.8.5 プロンプトをエスカレーションする
2.9 ユーザーを責めるな
2.10 ユーザーの習熟度
2.11 コンテキストを維持する以前の、Google がエイブラハム・リンカーン
2.12 ヘルプおよびその他のユニバーサルコマンド
2.13 遅延
2.14 曖昧さの回避
2.15 デザイン・ドキュメント
2.15.1 プロンプト
2.15.2 文法、キーフレーズ
2.16 アクセシビリティー
2.16.1 インタラクションは時間効率をよくすべきだ
2.16.2 手短に
2.16.3 早く話す！
2.16.4 いつでも割り込める
2.16.5 コンテキストを提示する
2.16.6 ユーザーが迷子にならないために
2.16.7 音声合成のパーソナル化
その他のタイプのアクセシビリティー
2.17 結論
3章ペルソナとビジュアルVUI
3.1 ペルソナ
3.2 VUI は姿を見せるべきか？
3.3 アバターを使ううえでやってはいけないこと
3.4 アバター（またはビデオ）を使ううえですべきこと
3.4.1 ストーリーテリング
3.4.2 チームワーク
3.4.3 ビデオゲーム
3.5 VUI でいつビデオを使うべきか
3.6 ビジュアルVUI のベストプラクティス
3.6.1 ユーザーは自分の顔を見るべきか？
3.6.2 GUI の扱い
3.6.3 エラーハンドリング
3.6.4 ターンの交代とバージイン
3.6.5 ユーザーとのエンゲージメントと認識のイリュージョン
3.7 アバターを使わないビジュアルフィードバック
3.8 声を選ぶ
3.9 アバターの利点
3.10 アバターの欠点
3.10.1 不気味の谷
3.11 結論
4章音声認識技術
4.1 音声認識エンジンの選択
4.2 バージイン
4.2.1 タイムアウト
4.2.2 終端検出のタイムアウト
4.2.3 無音タイムアウト
4.2.4 話が長すぎる
4.3 N-best リスト
4.4 音声認識の課題
4.4.1 ノイズ
4.4.2 複数話者
4.4.3 子供
4.4.4 名前とスペリングと英数字
4.5 データプライバシー
4.6 結論
5章高度なVUIデザイン
5.1 音声入力に応じた分岐
5.1.1 制約のある応答
5.1.2 オープンスピーチ
5.1.3 入力のカテゴリー分け
5.1.4 ワイルドカードと論理的表現
5.2 曖昧さ
5.2.1 情報不足
5.2.2 ひとつの情報しか想定していないときにふたつ以上の情報
5.3 否定の扱い
5.4 意図と目的を捉える
5.5 ダイアログマネジメント
5.6 ユーザーを宙ぶらりんにしない
5.7 VUI は認識したことを表示すべきか？
5.8 感情分析と感情検出
5.9 音声合成 vs 事前録音
5.10 話者認証
5.11 ウェイクワード
5.12 コンテキスト
5.13 高度なマルチモーダル
5.14 データセットを一から構築する
5.15 高度な自然言語理解
5.16 結論
6章 VUIのユーザーテスト
6.1 VUI 固有の注意点
6.2 ユーザーとユースケースの背景調査
6.3 実際のユーザーと一緒にテストを計画する (1/2)
6.3 実際のユーザーと一緒にテストを計画する (2/2)
6.4 初期段階でのユーザーテスト (1/2)
6.4 初期段階でのユーザーテスト (2/2)
6.5 ユーザビリティーテスト (1/2)
6.5 ユーザビリティーテスト (2/2)
6.6 測定基準
6.7 次のステップ
6.8 車載、デバイス、ロボットのVUIシステムをテストする
6.9 結論
7章 VUI 完成後にすべきこと
7.1 リリース前のテスト
7.2 性能を測定する (1/2)
7.2 性能を測定する (2/2)
7.3 ログを残す
7.4 文字起こし
7.5 段階的リリース
7.6 アンケート
7.7 分析
7.8 ツール
7.9 結論
8章音声対応デバイスと自動車
8.1 デバイス
画面のないデバイスのためのデザイン (1/2)
画面のないデバイスのためのデザイン (2/2)
8.2 自動車と自動運転車 (1/3)
8.2 自動車と自動運転車 (2/3)
8.2 自動車と自動運転車 (3/3)
8.3 結論
エピローグ
付録本書で取り上げた製品
日本版特別寄稿1 サービスから考えるVUIのデザイン
1.1 VUI とサービス
1.1.1 サービスの中でのVUI の位置付け
1.2 VUI デザイン
1.2.1 会話のゴール／ユーザーの意図
1.2.2 VUI のキャラクターのデザイン
1.2.3 会話の始め方と終わり方、そして中断
1.2.4 ユーザーに学んでもらう仕掛け
1.3 まとめ
日本版特別寄稿2 コミュニケーションロボットから学ぶVUI/UX
2.1 スマートスピーカーの登場
2.2 VUI/UX におけるコミュニケーションロボットという流れ
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (1/2)
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (2/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (1/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (2/2)
監訳者あとがき
索引 (1/2)
索引 (2/2)

Content preview from デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

私たちは不思議な時代を生きている。リビングのソファに座り、自分の声だけを使っ

て熊のグミを

500g

注文して

時間以内に配達してもらえるのだ（これができるのが

果たして良いことなのかどうかの議論は、別の本に譲ろう）。

最近の音声認識技術――人間が話したことをコンピューターに理解させるための技

術――の進歩はめざましい。

1999

年に私が

Nuance Communications

でボイスユー

ザーインターフェース（以下、

VUI

）のデザインを始めたとき、私が話した

checking



と

savings

の違いをコンピューターが認識したことに驚いた。今ではスマートフォ

ン（これも魔法のデバイスのひとつだ）に向かって「ここから

マイル以内にある

Wi-Fi

の使えるコーヒーショップを教えて」と言えば、見つかったすべての店への道

順を教えてくれる。

1950

年代にコンピューターが人間の想像力をかきたてるようになったころ、話し

言葉の認識は比較的容易な問題だと考えられていた。「何といったって……

歳児だっ

て言葉を理解できるのだから！」

しかし、ふたを開けてみると、コンピューターに言語を理解させることは極めて複

雑な作業だった。独特な言語のニュアンスや癖は人間でも理解するのに時間がかかる。

コンピューターがごく単純な命令を理解するためのプログラムを作るのに、人は何十

年もの時間を費やした。言語を真に理解できるのは物理的な存在だけだと信じる人た

ちもいた。なぜなら物理的な世界のコンテキスト（文脈）がわからなければ、 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9784873118581Other

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

by Cathy Pearl, 川本大功, 高橋信夫

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

デザインスプリント ―プロダクトを成功に導く短期集中実践ガイド

情報アーキテクチャ第4版 ―見つけやすく理解しやすい情報設計

Publisher Resources