ウォズニアック・テスト (Mr. Coffee Test) とは
ウォズニアック・テスト、またはミスター・コーヒー・テストは、
スティーブ・ウォズニアックが提唱した、
機械が汎用
人工知能(AGI)であるかを判断するためのテストです。これは、従来の
チューリング・テストの代替案として提案されました。
テストの概要
テスト内容はシンプルです。被験体となる
機械を、全く見知らぬ家(事前に間取りなどの情報を与えない)に招き入れます。そして、その家の住人にコーヒーを淹れてもらう、というタスクを与えます。もし
機械がこのタスクを自律的に実行できなければ、それは弱いAI(特化型AI)と見なされます。
テストの具体的なプロセスと評価ポイント
コーヒーを淹れるという一見単純なタスクですが、実際にはAGIに求められる高度な能力を試すことができます。
1.
環境認識とナビゲーション:
初めての家に入り、安全かつ効率的に移動できるか。
ドアの開閉、障害物の回避など、物理的な環境に対する適応能力が求められます。
リアルタイムでの物体検出や、動的な環境
マッピングの能力が不可欠です。
2.
問題解決能力:
コーヒーメーカー、コーヒー豆、フィルター、マグカップなど、必要な道具を認識し、探し出すことができるか。
これらの道具がどこにあるか、どのように使用するかを理解している必要があります。
3.
自然言語処理能力:
もし道具が見つからない場合、住人に質問して必要な情報を引き出すことができるか。
自然な言葉でコミュニケーションを取り、曖昧な指示や質問を理解する能力が試されます。
シンボルグラウンディング問題(言葉の意味を現実世界の概念と結びつけること)を解決している必要があります。
4.
社会的協調性:
コーヒーの温度が適切かどうか、カップを適切な力加減で持ち上げられるかなど、人間社会における暗黙のルールやマナーを理解し、守ることができるか。
相手に不快感を与えないように、状況に応じた適切な行動をとる必要があります。
ウォズニアック・テストの意義
ウォズニアック・テストは、AGIが現実世界で直面するであろう複雑な問題を、包括的に評価できる点で優れています。従来のテストでは評価が難しかった、認知的な柔軟性、問題解決能力、コミュニケーション能力、社会性などを総合的に判断できます。
2017年時点では、これらの課題は
人工知能研究における重要なテーマであり、ウォズニアック・テストは、その進捗を測るための有効な指標となりえます。
批判と妥当性について
ウォズニアック・テストに対しては、コーヒーを淹れることに特化したAI(弱いAI)でもクリアできるのではないか、という批判があります。しかし、テストの設計上、事前に環境情報を与えることは想定されていません。したがって、弱いAIがこのテストをクリアするには、あらゆる可能性を事前に検討する必要があり、現実的には困難です。また、ドアの形状や開け方、物の配置などは多種多様であり、AIには高度な認知的なロバスト性が求められます。
まとめ
ウォズニアック・テストは、単なる技術的な課題解決能力だけでなく、人間社会とのインタラクション能力も評価する、より現実的なAGIテストと言えるでしょう。AGI研究の進展とともに、その重要性はますます高まると考えられます。