純化定理
純化定理(Purification Theorem)は、1973年に
ノーベル経済学賞受賞者であるゲーム理論家、
ジョン・ハーサニによって発表された画期的な理論です。この定理は、ゲーム理論における混合戦略ナッシュ均衡の持つ、ある種の不可解さに対する合理的な説明を提供することを目的としています。
混合戦略ナッシュ均衡では、各プレーヤーは複数の行動を確率的に選択します。理論上、プレーヤーは自分が確率的に選択するどの行動を選んでも、得られる期待利得は同じであり、これらの行動間で「完全に無差別」であるとされます。しかし、もしプレーヤーが本当に無差別なのであれば、なぜわざわざ他のプレーヤーの戦略を無差別に保つために、特定の確率で行動を「混合」する必要があるのか、という疑問が生じます。純化定理は、この一見矛盾する側面に光を当てます。
ハーサニのアイデアは、混合戦略均衡を、プレーヤーがわずかな私的情報(他のプレーヤーからは知られていない情報)を持つ「
不完備情報ゲーム」における「純粋戦略均衡」の極限として捉え直すというものです。ここで言う
不完備情報ゲームとは、元の
完備情報ゲームに、各プレーヤーの利得にごくわずかな個人的な変動(ノイズ)が加わった状況を指します。この個人的な変動は、そのプレーヤー自身だけが正確に知っており、他のプレーヤーにとっては不確実な要素です。
このような
不完備情報ゲームにおいて、各プレーヤーは自身の知っている私的情報に基づいて、最適な「純粋戦略」を選択します。純粋戦略とは、確率的な選択ではなく、特定の情報が満たされた場合に取る行動が確定的に決まる戦略です。例えば、「私の私的情報がこの値以下ならば行動Aを、そうでなければ行動Bを選ぶ」といった戦略になります。
外から見るとプレーヤーが確率的に行動を選んでいるように見える混合戦略は、実は、プレーヤーたちが持つ私的情報が特定の確率分布に従っており、その情報に基づいて各自が純粋戦略を実行した結果として現れる現象である、と純化定理は説明します。プレーヤーの集団全体を見たときに、様々な私的情報を持つ個々のプレーヤーの純粋戦略の選択が集計され、ある行動が特定の確率で選択されているように観察されるのです。
そして、この利得に加わる私的情報の不確実性や変動の「幅」がゼロに近づいていく極限を考えると、
不完備情報ゲームにおけるプレーヤーたちの純粋戦略均衡は、もともとの変動がなかった
完備情報ゲームで予測された混合戦略均衡へと収束していくことが示されます。この結果により、混合戦略は、理想化された
完備情報下のゲームで現れる特異な振る舞いではなく、現実世界によくある「わずかな不確実性」や「私的情報」が存在する場合における、プレーヤーの合理的な純粋戦略の自然な帰結であると解釈できるようになります。
この定理の考え方は、
進化ゲーム理論の現代の研究においても重要な基礎となっています。
進化ゲーム理論の文脈では、ゲームをプレーする集団内の異なる「タイプ」を持つプレーヤーの分布として、この私的情報の変動が解釈されることがあります。
具体的な例として、ゲーム理論の古典的な例であるタカ–ハトゲームを考えてみましょう。このゲームには、特定の確率で攻撃的(タカ)または回避的(ハト)な行動を混合する戦略が存在し、それが安定した状態(混合戦略ナッシュ均衡)となり得ます。ここに、各プレーヤーがハト的な行動を選ぶ際に個人的に負担するわずかな追加コストを導入します。このコストはプレーヤーごとに異なり、他のプレーヤーには分かりません。この不
完備情報下でのゲームでは、各プレーヤーは自身のコストと相手の反応を考慮して、ハトを選ぶかタカを選ぶかの純粋戦略を採ります。私的コストが一定の閾値より低ければハトを選び、高ければタカを選ぶといった形です。この私的コストの変動幅がゼロに近づくと、ハトを選ぶプレーヤーの確率が、元の
完備情報ゲームの混合戦略均衡でハトを選ぶ確率に一致することが示されます。この例は、見かけ上の混合戦略が、私的情報に基づく純粋戦略からどのように導かれるかを直感的に示しています。
ただし、純化定理の厳密な証明には、導入される私的情報の変動がプレーヤー間で統計的に独立であるなど、いくつかの技術的な仮定が伴います。また、すべての混合戦略均衡が同一の不確実性の構造によって純化できるわけではないなど、定理が適用できないケースも存在します。特に、弱く支配される戦略を含む混合戦略は、わずかな不確実性の導入によっても最適反応から外れやすいため、純化が難しい場合があります。
これらの限界はあるものの、純化定理は混合戦略の解釈に確固たる根拠を与え、不確実性下の戦略的行動を理解するための強力な枠組みを提供した点で、ゲーム理論における非常に重要な成果と言えます。