スタグハントゲーム

スタグハントゲームとは

「スタグハントゲーム（Stag Hunt Game）」は、ゲーム理論において、互いの協調が参加者全体の利益を最大化する一方で、非協力的な行動にも安定した結果が存在しうる状況をモデル化した概念です。このゲームの名前は、フランスの哲学者ジャン＝ジャック・ルソーが著書『人間不平等起源論』で用いた「鹿狩りの寓話」に由来しています。寓話では、二人の狩人が協力して鹿を捕えれば大きな獲物を得られますが、一人で鹿を追うことはできず、その間に他の狩人が裏切ってウサギを捕獲した場合、何も得られなくなるリスクを負います。もし最初からウサギを狙えば、鹿より小さいものの確実な獲物を得ることができます。

ゲームの典型的な設定では、プレイヤーは二人おり、それぞれ「鹿を追う（協力）」または「ウサギを捕獲する（非協力）」という二つの行動を選択できます。両方のプレイヤーが鹿を追えば、それぞれが最も高い利得（例えば2）を得られます。しかし、片方だけが鹿を追い、もう片方がウサギを捕獲した場合、鹿を追ったプレイヤーは何も得られず（利得0）、ウサギを捕獲したプレイヤーは単独でも得られる小さな利得（例えば1）を得ます。両方のプレイヤーがウサギを捕獲した場合も、それぞれが小さな利得（1）を得ることになります。

ゲーム理論による分析

スタグハントゲームの大きな特徴は、複数のナッシュ均衡が存在することです。ナッシュ均衡とは、どのプレイヤーも他のプレイヤーの行動を所与としたときに、自身の利得を最大化する行動から逸脱するインセンティブがない状態を指します。スタグハントでは、双方が鹿を追う状態（協調）と、双方がウサギを捕獲する状態（非協調）の両方が純粋戦略ナッシュ均衡となります。

協調の結果である「双方が鹿を追う」均衡は、参加者全員にとって、他のどの均衡よりも高い利得をもたらします。このような均衡は「利得支配均衡」と呼ばれます。全員が協力することで、最適な結果が得られることを示しています。

一方、「双方がウサギを捕獲する」均衡も安定しています。これは、相手がウサギを捕獲している場合、自分が鹿を追っても何も得られないため、自身もウサギを捕獲する方が得策だからです。また、ウサギを捕獲する戦略は、相手がどのような行動を選んだとしても、プレイヤーが最低限確保できる利得（この例では1）が最も高い戦略でもあります。これは「マキシミン戦略」の考え方と関連付けられます。

さらに、「双方がウサギを捕獲する」均衡は「危険支配均衡」とも呼ばれます。これは、もし均衡から逸脱して別の行動を選択した場合に被る可能性のある損失が、他の均衡と比較して小さい（またはゼロに近い）均衡を指します。例えば、全員が鹿を追う均衡を期待している状況で、もし相手が裏切ってウサギを選んだ場合、鹿を追ったプレイヤーは大きな損失（利得が2から0へ減少）を被ります。対照的に、全員がウサギを捕獲する均衡を期待している状況で、もし相手が協調して鹿を選んだとしても、ウサギを捕獲したプレイヤーの利得は変わらず（1のまま）損失は発生しません。このリスクの非対称性が、安全策としての非協調均衡の安定性を示唆しています。

スタグハントゲームにおける意思決定の不確実性は、全員で協力して大きな利益を得たいという共通の願望と、他のプレイヤーが協力しない場合に自身が何も得られなくなるリスクを回避したいという個人的な動機が対立することによって生じます。プレイヤーは、他のプレイヤーが協調する可能性について推測し、自身の行動を決定する必要があります。

関連するゲームとの比較

スタグハントゲームは、他の協調に関連するゲームと比較することで理解が深まります。

例えば、公共財ゲームもスタグハントと同様の性質を持つ場合があります。公共財を提供するには費用がかかりますが、多くの人が協力して提供すれば、費用を上回る大きな便益が全員に生じることがあります。しかし、一部の人が費用負担を避けて便益だけを享受しようとする（フリーライド）可能性があります。参加者が協力するインセンティブが、非協力のリスクを上回る特定の条件下（例えば、フリーライダーを排除するメカニズムがある、協力による相乗効果が大きいなど）では、公共財ゲームはスタグハントゲームと類似した構造を示します。

また、有名な囚人のジレンマは、協調が全体最適であるにも関わらず、自己の利益のみを追求すると非協調が支配戦略となるゲームです。しかし、もし囚人のジレンマが無期限に繰り返し行われる場合、プレイヤーは将来の協調を期待して現在の協力的な行動をとることが合理的になることがあります。このような繰り返しゲームにおいては、全体として高い利得を得られる複数の均衡が存在することが知られており（フォーク定理）、特定の繰り返し戦略を採用することで、繰り返し囚人のジレンマはスタグハントのような協調ゲームの性質を帯びるようになります。繰り返し行われるインタラクションの中には、表面的には囚人のジレンマに見えても、実質的にはスタグハントのような協力的な性質を持つものが多いと言えます。

現実社会におけるスタグハント

スタグハントゲームの構造は、現実社会の様々な状況に当てはまります。

経済学においては、戦略的補完性が見られる状況の基礎的なモデルとなり得ます。例えば、ある場所に企業が集積すると（協力）、関連産業のサプライヤーが集まりやすくなり、労働市場が厚みを増し、技術的な知識交換も促進されるなど、個々の企業が単独で立地するよりも大きな便益を得られる場合があります。しかし、他の企業がどこに立地するか不確実な状況では、単独で集積地に投資するリスクを避けるインセンティブも働きます。インターネットオークションや株式市場など、多くの売り手と買い手が一ヶ所に集まることで市場の流動性が高まり、取引が活発になる現象も、このような戦略的補完性の一例であり、スタグハントの構図で捉えることができます。

具体的な人間社会の協力の例として、インドネシアのロンブレン島ラマレラ村で行われる伝統的な捕鯨が挙げられます。捕鯨は非常に危険で、船長、航海士、銛を投げる者など、それぞれの役割を果たす複数の漁師が緊密に協力しないと成功しません。誰か一人でも役割を果たさなかったり、参加しなかったりすれば、捕獲の可能性は著しく低下します。しかし、漁師たちは陸上で他の活動（沿岸での漁労、畑仕事など）を行って安定した生活を送ることも可能です。他の漁師が捕鯨に参加する見込みが高いときは自身も参加したいと考える一方で、参加者が足りない場合はリスクを避けて陸に留まる方が合理的である、という判断は、まさにスタグハントゲームにおける協力とリスク回避の選択と類似しています。このような伝統的な共同作業は、参加者の協力が必須であり、かつ非協力という安全な選択肢も存在するというスタグハントの構造によって維持されていると考えられます。

スタグハントゲームは、集団における協調がいかに望ましい結果をもたらすかを示す一方で、その実現には相互の信頼や期待、そして裏切りに対するリスク管理が重要であることを教えてくれます。複数の安定した均衡が存在するため、社会がどの均衡に落ち着くかは、初期の状況、コミュニケーション、文化、制度などに影響されると考えられています。

もう一度検索