ユーザビリティテスト

ユーザビリティテストとは

ユーザビリティテスト（またはユーザテスト）とは、ユーザー中心設計におけるインタラクションデザインで、製品を実際にユーザーに使ってもらい評価する手法です。これにより、「ユーザーがどのようにシステムを扱うか」という直接的な知見が得られます。これは、ユーザーの意見を聞くことなくインターフェースを評価するユーザビリティ検証とは対照的です。

ユーザビリティテストの目的

ユーザビリティテストは、製品が意図された目的にどれだけ適うかを測ることに重点を置いています。食品、消費者向け製品、ウェブサイト、アプリ、CPUインターフェース、文書、装置など、幅広い製品の使いやすさを評価できます。一方、人間とコンピュータの相互作用を研究する分野では、普遍的な原則を定めることを目指します。

ユーザビリティテストではないもの

単に意見を集める市場調査や定性調査は、ユーザビリティテストではありません。ユーザビリティテストは、統制された条件下で組織的な観察を行い、ユーザーが製品をどれだけ上手く使用できるかを検証します。ただし、ユーザーの行動に加え、その動機や認識を深く理解するために、定性調査と併用されることもあります。

例えば、草稿を見せて「内容が分かりますか？」と問うのではなく、実際に製品を意図された用途で使用する様子を観察します。組み立て式おもちゃの説明書であれば、説明書とおもちゃを与え、実際に組み立ててもらいます。これにより、説明書の文章、図の質、おもちゃのデザインなど、組み立て工程に影響する要素を評価します。

ユーザビリティテストの手法

ユーザビリティテストでは、観察者が記録を取る中、入念に設計されたシナリオや現実的な状況下で、被験者が製品を使ったタスクを行います。指示書やペーパープロトタイプ、事前/事後アンケートなども活用し、製品に対するフィードバックを得ます。

例えば、メールの添付機能を検証する場合、ユーザーが添付メールを送る状況を説明し、そのタスクを要求します。開発者は、ユーザーが普段通りに行動する様子を観察し、問題点やユーザーの嗜好を把握します。思考発話、共同発見学習、アイトラッキングなどの手法も、データ収集に利用されます。

ホールウェイテスト

ホールウェイテストは、手軽なユーザビリティテスト手法の一つで、無作為に選ばれたユーザー（例えば、廊下や街頭を歩いている人）に製品を使ってもらうものです。初期段階で、致命的な問題を早期発見するのに役立ちます。プロジェクト関係者やエンジニア以外を対象とするのがポイントです。

リモートユーザテスト

ユーザビリティ評価者、開発者、将来のユーザーが異なる場所やタイムゾーンにいる場合、リモートユーザビリティ評価が有効です。リモートテストは、同期式と非同期式に分けられます。

同期式テストでは、ビデオ会議などのツールでリアルタイムにやり取りします。一方、非同期式テストでは、ユーザーと評価者が別々に作業を行い、クリックストリームやログを収集し、インターフェースへのフィードバックを自動的に集めます。これにより、ユーザーの環境下でテストを行うことができ、現実的なシナリオを再現できます。また、遠隔地にいるユーザーから迅速かつ容易にフィードバックを得ることができます。

専門家審査

専門家審査は、ユーザビリティの専門家が製品のユーザビリティを評価する手法です。ヒューリスティック評価（またはユーザビリティ監査）では、専門家が、例えばヤコブ・ニールセンが提唱した10のユーザビリティヒューリスティックなどの原則に基づいて評価を行います。

ニールセンのユーザビリティヒューリスティックの例

システム状態の視認性
システムと現実世界の調和
ユーザーコントロールと自由度
一貫性と標準化
エラーの防止
記憶しなくても、見ればわかるように
柔軟性と効率性
美的で最小限のデザイン
エラー認識、診断、回復のサポート
ヘルプとマニュアル

自動化された専門家審査

自動化された専門家審査では、プログラムを用いて、良いデザインやヒューリスティックのルールに基づいてテストを行います。人間による評価に比べ、見識や具体性は劣る場合があるものの、より迅速かつ安定して実施できます。

A/Bテスト

Web開発やマーケティングでは、A/Bテスト（または多変量テスト）が用いられます。これは、Webページ上の要因を特定し、特定の成果（例えば、バナー広告のクリック率）を最大化させるための実験的なアプローチです。2つのバージョン（AとB）を比較し、ユーザーの行動に影響を及ぼす可能性のある1つの要因を除いて、他の全てを同じにします。多変量テストでは、同時に2つ以上のバージョンをテストします。

ユーザビリティテストの対象人数

ヤコブ・ニールセンは、開発工程の随所で、少人数（5人程度）のユーザビリティテストを複数回行うことを提唱しました。彼は、2、3人のユーザーが問題に気づけば、それ以上の人数をテストしても得られるものは少ないと述べました。この主張は、「U = 1 - (1 - p)^n」という数理モデルで説明され、1人のユーザーが問題を発見する確率をp、ユーザー数をnとした場合、発見される問題の割合Uを計算できます。

ニールセンの主張への異議

しかし、以下の異議も存在します。

ユーザビリティは特定のユーザーグループに関連するため、少なすぎる標本数は母集団を代表しない可能性がある。
ユーザビリティ上の問題が見つけやすいとは限らず、解決困難な問題は全体の作業を減速させる可能性がある。

ユーザビリティテストの実施方法

ニールセンは、5人のユーザーでテストを行い、問題を修正後、さらに別の5人で検証することを推奨しています。つまり、10人で1回のテストを行うよりも、5人ずつ複数回行う方が、より効率的ということです。実際には、テストは開発サイクル内で定期的に行われ、1回のテストで3～5人のユーザーが参加し、その結果はデザイナーに迅速に共有されます。これにより、プロジェクト全体では50～100人のユーザーがテストに参加することも珍しくありません。

最初の段階では、平均的な知識レベルを持つユーザーを対象とし、次の段階では、幅広い特性を持つユーザーを対象とするのが良いでしょう。デザインがスムーズになるにつれ、特定の母集団からユーザーを選ぶ必要が出てきます。この手法を適切に適用することで、少人数でテストを繰り返しても、十分な数のユーザーにテストしたことになります。

まとめ

ユーザビリティテストは、製品のユーザビリティを向上させるために不可欠なプロセスです。少人数で何度もテストを繰り返すことで、効率的に問題を洗い出し、より使いやすい製品へと改善できます。テスト手法も様々であり、目的に応じて使い分けることが重要です。

テスト例

Apple Computerのマニュアルには、「ターゲット層を決め、その知識レベルを把握し、ターゲット層のニーズに合わせたユーザーインターフェースをデザインする」と記述がありました。また、「友人、親戚、新入社員を対象にすぐにテストすべき」とも助言しています。

脚注

1. ユーザビリティテスト - Wikipedia

外部リンク

Usability.gov
A Brief History of the Magic Number 5 in Usability Testing (英語)

もう一度検索