主人と奴隷戦略
ゲーム理論、特に無期限に繰り返される非
ゼロ和ゲームである「
囚人のジレンマ」において用いられる
戦略の一つ。この
戦略は「主人と奴隷
戦略」または「主人-奴隷
戦略」とも表記されることがあります。
開発と登場
このユニークな
戦略は、
2004年に開催された「
囚人のジレンマ」誕生20周年記念大会で初めて世に知られました。この大会は、無期限繰り返し設定での
囚人のジレンマゲームにおいて、様々なプログラムがその
戦略の優劣を競う国際的なイベントでした。本
戦略は、
イギリスの
サウサンプトン大学に所属する研究チームによって開発されました。チームを率いたのはニック・ジェニングズ教授と、当時大学で博士課程に在籍していたゴーパル・ラムチャーンです。
サウサンプトン大学チームは、この大会に合計60もの異なるプログラムをエントリーさせるという、他に類を見ない規模で参加しました。
主人と奴隷
戦略の核心は、まず対戦相手が自チームのプログラムであるか否かを初期段階で判別しようとすることにあります。そのための具体的な手順は以下のようになります。
1.
相手の識別フェーズ: 対戦が開始されてから最初の5回から10回程度の試行において、あらかじめ決められた特定の協調(協力)と裏切り(非協力)の行動パターンを相手に対して繰り返します。この初期の行動パターンに対する相手の反応を分析することで、その相手が同じ
サウサンプトン大学チームが投入したプログラム(つまり「仲間」)なのか、それとも他のチームのプログラムなのかを判断します。
2.
識別後の行動:
相手が自チームではないと判断された場合: その相手が「仲間ではない」と判別された場合、以降のゲームの進行においては常に「裏切り」を選択し続けます。これは、非協力的な相手に対して、自らの得点を最大化しつつ相手の得点を可能な限り引き下げるという、典型的な裏切り
戦略の行動様式です。
相手が自チームであると判断された場合: その相手が「仲間」であると判別された場合、対戦しているプログラムは事前に割り当てられた自チーム内での役割に基づいて行動します。
サウサンプトン大学チームが投入したプログラムの中には、「主人」と「奴隷」という二種類の役割が設定されていました。
「奴隷」の役割を与えられたプログラムは、対戦相手が自チームの「主人」であると判断した場合、ゲームが続く限り常に「協調」を選択します。
一方、「主人」の役割を与えられたプログラムは、対戦相手が自チームの「奴隷」であると判断した場合、ゲームが続く限り常に「裏切り」を選択します。
このチーム内での「主人」と「奴隷」の組み合わせによる対戦は、
囚人のジレンマのルール、すなわち「自分が裏切り、相手が協調した場合に最も高い得点を得られる」という構造を最大限に利用したものです。これにより、チーム内の対戦においては、主人役のプログラムが奴隷役のプログラムから一方的に得点を収奪することが可能となります。
大会での成績
2004年の記念大会において、この主人と奴隷
戦略を採用した
サウサンプトン大学チームは目覚ましい成績を収めました。彼らのプログラムは、それまで長年にわたり最強
戦略と見なされてきた「しっぺ返し(Tit-for-Tat)」や、その多様な改良
戦略を含む他の多くの参加プログラムを凌駕し、見事優勝を果たしました。さらに、大会の総合成績において上位3位を
サウサンプトン大学のプログラムが独占するという圧倒的な結果を残しました。
ただし、チームとして大量のプログラムを投入したことには、成績における明暗が伴いました。特に「奴隷」の役割を与えられたプログラムは、自チームの「主人」に対しては常に協調することでその得点獲得に貢献する一方、他のチームのプログラムから裏切られた際にはその性質上、得点が大きく低下してしまいます。このため、大会の最終的な成績リストの下位には、多数の奴隷役プログラムが含まれることとなりました。
受賞
大会での輝かしい優勝を受けて、
サウサンプトン大学チームの代表であるニック・ジェニングズ教授は、優勝者として50ドルの賞金小切手と記念の小さなプレートを授与されました。