
185
6.6
測定基準
6.6
測定基準
測定データは、定性的なデータと定量的なデータの両方を集めることを推奨する。
この組み合わせが重要なのは、ひとつの評価は必ずしも全体像を表さないからだ。た
とえば、ユーザーはタスクをうまくできたと思っていても、デザイナーであるあなた
は何かが気に入らないかもしれない。あるいは、厳密にはタスクは成功していないが、
気にする必要がないという場合もある。
Balogh
がこう説明している。「被験者が失敗しても、本人は気にしていないことも
ある」。私は
Volio
のユーザビリティーテストでこれを体験した。いくつかのケースで、
ユーザーの発話が正しく認識されないことがあったのだが、エラー対応が比較的穏や
かだったために、ユーザーはそのためにアプリを低く評価しなかった。もし、エラー
回数だけを記録していたなら、結果は違っていただろう。
定量的な評価を行うためには、観察結果を集計し、印象だけに頼らないことが重要
だ。
Balogh
がこう言っている。
ときとして、ある被験者があなたに強い印象を与えたが、実際の行動回数を
数えてみると、結論はこのひとりの人物が経験したものとは異なっているこ
とがある。
彼女は、ある研究を引用して、
VUI
システムをテストする際の重要な評価基準を
5
種類挙げている。それは正確さとスピード、認識能力、透明性/複雑さ、親しみやす
さ、声
*10
である。
タスクごとに「タスク完了」の意味を事前に決めておくこと。ユーザーがタスクを
途中まで実行して、完了する前にやめてしまった ...