フォーク定理

フォーク定理



概要



フォーク定理(英: folk theorem)は、ゲーム理論、特に繰り返しゲームの分野における極めて重要な概念です。この定理が主張するのは、ある条件の下では、プレイヤーにとって個人合理性を満たすどのような行動パターンやその結果として得られる利得の組み合わせも、その繰り返しゲームにおけるナッシュ均衡、あるいはより厳密にはサブゲーム完全均衡として成立しうる、という可能性です。

名前の由来



「フォーク (folk)」という名前は、数学などの学術分野でしばしば用いられる俗称に由来します。これは、多くの専門家の間で「おそらく正しいだろう」「証明は容易につくだろう」と考えられているにもかかわらず、正式な論文として発表されたり、厳密な証明が公に提供されたりすることが長らくなかった知識や定理を指す言葉です。フォーク定理の場合も、繰り返しゲームにおけるある種の帰結については、比較的早い段階で研究者の間で広く認識されていましたが、その厳密な証明や定式化は後になって行われました。このような歴史的な背景から、この定理は「フォーク定理」と呼ばれるようになりました。

繰り返しゲームと協調



有限回で終了することがあらかじめ分かっているゲーム、例えば典型的な囚人のジレンマのようなゲームでは、一般的にプレイヤーは互いに協力しない非協力解を選択するのが合理的な結果(均衡)となります。なぜなら、ゲームの最終回では将来の報復を恐れる必要がなくなり、その論理が一つ前の回へと連鎖していくためです。

しかしながら、ゲーム無限に、あるいは不確定期限で繰り返し行われる場合、状況は大きく変化します。このような設定では、プレイヤーは自己の短期的な利益だけでなく、将来にわたる関係性や得られる利得を考慮に入れるようになります。この長期的な視点が入ることで、互いに協力し合う協調的な結果もまた、ゲームの均衡として成立する可能性が生まれます。

将来価値の評価と均衡



フォーク定理の厳密な成立には、プレイヤーが将来の利得をどの程度重視するかが鍵となります。ゲーム理論では、これは割引因子という概念で表現されます。割引因子が高い(1に近い)ということは、プレイヤーが将来得られる1単位の利得を、現在得る1単位の利得とほぼ同じ価値があると評価することを意味します。割引因子が十分に大きい、つまり将来の利得が現在と同程度に評価されるならば、短期的な裏切りによる一時的な利益よりも、協調を持続することによって長期的に得られる大きな利益の方が魅力的になります。

ゲーム理論家のアリエル・ルービンシュタインらは、将来利得の割引因子が一定の条件(十分に大きい)を満たす場合、プレイヤーにとって互いにパレート効率的であるような(すなわち、どのプレイヤーの利得も減らすことなく、他のプレイヤーの利得を増やすことができないような)、望ましい結果を含む多様な協調的利得の組み合わせが、繰り返しゲームサブゲーム完全均衡として実現可能であることを示しました。これは、ゲームのどの時点から見ても、プレイヤーが互いに最適な応答戦略を取るという意味で、より強固な均衡概念です。

報復可能性とミニマックス利得



無限回ゲームが協調的な均衡を可能にする理由の一つは、報復が可能になる点です。もしあるプレイヤーが協調を破って非協力的な行動を取った場合、他のプレイヤーはそれに応じて将来のゲームで同様に非協力的な行動を取ることで報復できます。この報復の可能性が、短期的な裏切りに対する抑止力となります。

繰り返しゲームにおいて、他のプレイヤーが自分(プレイヤーi)の利得を可能な限り低く抑え込もうと行動する場合に、自分自身がどうしても避けられない最低限の利得のことをミニマックス利得と呼びます。これは、自分以外のプレイヤーが自分に対して最も敵対的な戦略を取る際に、プレイヤーiが最適な応答をしてもこれ以上にはできない、という最低限の保証利得のようなものです。フォーク定理が示す均衡では、通常、プレイヤーは互いのミニマックス利得を上回る利得を得ることができます。

具体例:しっぺ返し戦略



フォーク定理の直感的な理解を助ける具体的な戦略として、しっぺ返し戦略(Tit-for-Tat)が挙げられます。これは、「ゲームの最初の回では協力し、それ以降の回では直前の回で相手が取った行動をそのまま繰り返す(相手が協力したら自分も協力、相手が裏切ったら自分も裏切る)」という単純な戦略です。

プレイヤーが将来の利得を高く評価する(割引因子が大きい)状況で、もし相手がしっぺ返し戦略を取っているとします。自分がここで一度裏切ると、その回の利益は一時的に増えます。しかし、次の回には相手から裏返しとして報復(非協力)を受け、それ以降の利得は大きく損なわれる可能性があります。十分に長い期間を考えると、この損失は最初の短期的な利益を上回るかもしれません。逆に、相手が裏切ってきた場合、自分が報復しないと相手の裏切りが続くことになり、自分の利得は継続的に低いままになります。したがって、しっぺ返し戦略に従って報復することが、長期的な視点では自己の利益を守る行動となります。

このように、将来を十分に重視するプレイヤー間では、「しっぺ返し戦略」のような報復を含む戦略が互いに最適な応答となり、安定した均衡を形成し得ます。そして、このような均衡状態では、事前の明示的な契約がなくとも、プレイヤー間の暗黙の期待と戦略的な相互作用によって協調が維持され、互いにミニマックス利得を大きく上回る結果が実現されるのです。フォーク定理は、このような繰り返しゲームにおける協調の可能性とその条件を広く捉えた、ゲーム理論における重要な定理と言えます。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。