book

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

Name: デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則
ISBN: 9784873118581

by Cathy Pearl, 川本大功, 高橋信夫

November 2018

Beginner to intermediate

304 pages

6h 11m

Japanese

O'Reilly Japan, Inc.

Read now

Unlock full access

1.1.2 なぜVUI なのか？
1.2 会話型ユーザーインターフェース
1.2.1 Alexa をインタビューする
1.3 VUI デザイナーとは何か？
1.4 チャットボット
1.5 結論
2章 VUIデザイン原理の基本
2.1 モバイルデバイス向けVUI デザインとIVR システム向けVUI デザイン
2.2 会話型デザイン
2.3 ユーザーに期待している行動を促す
2.4 デザインツール
2.4.1 対話サンプル
2.4.2 ビジュアル・モックアップ
2.4.3 フロー
2.4.4 プロトタイピングツール
2.5 確認
2.5.1 【方法1】3 段階の信頼度
2.5.2 【方法2】暗黙の確認
2.5.3 【方法3】沈黙による確認
2.5.4 【方法4】汎用的確認
2.5.5 【方法5】ビジュアルな確認
2.6 コマンド制御型 vs 会話型
2.6.1 コマンド制御方式
2.6.2 会話方式
2.7 会話マーカー
2.8 エラーハンドリング
2.8.1 音声が検出されなかった
2.8.2 音声は検出されたが何も認識できなかった
2.8.3 認識されたが処理できなかった
2.8.4 認識したが誤っていた
2.8.5 プロンプトをエスカレーションする
2.9 ユーザーを責めるな
2.10 ユーザーの習熟度
2.11 コンテキストを維持する以前の、Google がエイブラハム・リンカーン
2.12 ヘルプおよびその他のユニバーサルコマンド
2.13 遅延
2.14 曖昧さの回避
2.15 デザイン・ドキュメント
2.15.1 プロンプト
2.15.2 文法、キーフレーズ
2.16 アクセシビリティー
2.16.1 インタラクションは時間効率をよくすべきだ
2.16.2 手短に
2.16.3 早く話す！
2.16.4 いつでも割り込める
2.16.5 コンテキストを提示する
2.16.6 ユーザーが迷子にならないために
2.16.7 音声合成のパーソナル化
その他のタイプのアクセシビリティー
2.17 結論
3章ペルソナとビジュアルVUI
3.1 ペルソナ
3.2 VUI は姿を見せるべきか？
3.3 アバターを使ううえでやってはいけないこと
3.4 アバター（またはビデオ）を使ううえですべきこと
3.4.1 ストーリーテリング
3.4.2 チームワーク
3.4.3 ビデオゲーム
3.5 VUI でいつビデオを使うべきか
3.6 ビジュアルVUI のベストプラクティス
3.6.1 ユーザーは自分の顔を見るべきか？
3.6.2 GUI の扱い
3.6.3 エラーハンドリング
3.6.4 ターンの交代とバージイン
3.6.5 ユーザーとのエンゲージメントと認識のイリュージョン
3.7 アバターを使わないビジュアルフィードバック
3.8 声を選ぶ
3.9 アバターの利点
3.10 アバターの欠点
3.10.1 不気味の谷
3.11 結論
4章音声認識技術
4.1 音声認識エンジンの選択
4.2 バージイン
4.2.1 タイムアウト
4.2.2 終端検出のタイムアウト
4.2.3 無音タイムアウト
4.2.4 話が長すぎる
4.3 N-best リスト
4.4 音声認識の課題
4.4.1 ノイズ
4.4.2 複数話者
4.4.3 子供
4.4.4 名前とスペリングと英数字
4.5 データプライバシー
4.6 結論
5章高度なVUIデザイン
5.1 音声入力に応じた分岐
5.1.1 制約のある応答
5.1.2 オープンスピーチ
5.1.3 入力のカテゴリー分け
5.1.4 ワイルドカードと論理的表現
5.2 曖昧さ
5.2.1 情報不足
5.2.2 ひとつの情報しか想定していないときにふたつ以上の情報
5.3 否定の扱い
5.4 意図と目的を捉える
5.5 ダイアログマネジメント
5.6 ユーザーを宙ぶらりんにしない
5.7 VUI は認識したことを表示すべきか？
5.8 感情分析と感情検出
5.9 音声合成 vs 事前録音
5.10 話者認証
5.11 ウェイクワード
5.12 コンテキスト
5.13 高度なマルチモーダル
5.14 データセットを一から構築する
5.15 高度な自然言語理解
5.16 結論
6章 VUIのユーザーテスト
6.1 VUI 固有の注意点
6.2 ユーザーとユースケースの背景調査
6.3 実際のユーザーと一緒にテストを計画する (1/2)
6.3 実際のユーザーと一緒にテストを計画する (2/2)
6.4 初期段階でのユーザーテスト (1/2)
6.4 初期段階でのユーザーテスト (2/2)
6.5 ユーザビリティーテスト (1/2)
6.5 ユーザビリティーテスト (2/2)
6.6 測定基準
6.7 次のステップ
6.8 車載、デバイス、ロボットのVUIシステムをテストする
6.9 結論
7章 VUI 完成後にすべきこと
7.1 リリース前のテスト
7.2 性能を測定する (1/2)
7.2 性能を測定する (2/2)
7.3 ログを残す
7.4 文字起こし
7.5 段階的リリース
7.6 アンケート
7.7 分析
7.8 ツール
7.9 結論
8章音声対応デバイスと自動車
8.1 デバイス
画面のないデバイスのためのデザイン (1/2)
画面のないデバイスのためのデザイン (2/2)
8.2 自動車と自動運転車 (1/3)
8.2 自動車と自動運転車 (2/3)
8.2 自動車と自動運転車 (3/3)
8.3 結論
エピローグ
付録本書で取り上げた製品
日本版特別寄稿1 サービスから考えるVUIのデザイン
1.1 VUI とサービス
1.1.1 サービスの中でのVUI の位置付け
1.2 VUI デザイン
1.2.1 会話のゴール／ユーザーの意図
1.2.2 VUI のキャラクターのデザイン
1.2.3 会話の始め方と終わり方、そして中断
1.2.4 ユーザーに学んでもらう仕掛け
1.3 まとめ
日本版特別寄稿2 コミュニケーションロボットから学ぶVUI/UX
2.1 スマートスピーカーの登場
2.2 VUI/UX におけるコミュニケーションロボットという流れ
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (1/2)
インタビュー：渡部知香氏株式会社ヘッドウォータースUX/UI デザイナー・ロボットアプリクリエーター (2/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (1/2)
インタビュー：春田英和氏アビダルマ株式会社エンジニア (2/2)
監訳者あとがき
索引 (1/2)
索引 (2/2)

Content preview from デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

7.4

文字起こし

206

情報は会話の各ターンのあとに記録するのがよい。ユーザーが突然やめてしまった

り、アプリがクラッシュしたりするかもしれないからだ。ユーザーが優雅な結論に至

るようなベストケースのシナリオだけを記録していると、データの重要な部分を失う

ことになる。

言うまでもないことだが、音声データは匿名化したうえで、分析以外の目的に使用

してはならない。

7.4

文字起こし

システムの性能を正確に分析するためには、もうひとつ重要な作業が必要だ。それ

はユーザーが

VUI

に話した音声を人間が聞き、（手で）文字起こしすることである。

「でも待ってくれ」とあなたは言うかもしれない。「今の音声認識の精度は

％だと

いうじゃないか！

私は文字起こしを自動で行いたい。その方がずっと安い」。

確かに、多くのケースで音声認識結果は非常に正確だ。しかし、そうでない場合も

多い。ユーザーが実際に話した会話を使ってデータセットを作ったり改善したりする

場合、誤ったデータを使ってしまうと成功することは困難になる。

Balentine

と

Morgan

が言うように、「音声認識の性能を判定する唯一正確な方法は、個々の発話

のログを残して、オフラインで文字起こしすることだ」。

文字起こしの費用は高いが、少なくとも一部でもデータを文字起こししなければ、

良い

VUI

を作ることはできない。文字起こしを専門にしている会社には、この分野

で経験豊富な

Appen

などがあり、他にもこのサービスを提供している小さな会社が

たくさんある。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9784873118581Other

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

デザイニング・ボイスユーザーインターフェース ―音声で対話するサービスのためのデザイン原則

by Cathy Pearl, 川本大功, 高橋信夫

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

デザインスプリント ―プロダクトを成功に導く短期集中実践ガイド

情報アーキテクチャ第4版 ―見つけやすく理解しやすい情報設計

Publisher Resources