プロパー均衡
プロパー均衡(Proper Equilibrium)は、
協力ゲーム理論における主要な
解概念であるナッシュ均衡をさらに洗練させる目的で考案された、重要な均衡概念です。特に、ゲーム理論家の
ロジャー・マイヤーソンによって1978年に提唱されました。この概念は、
ラインハルト・ゼルテンが提案した摂動完全均衡(Perturbation Perfect Equilibrium)をさらに発展させたものです。プレーヤーが非合理的な行動をとる可能性を考慮する点では摂動完全均衡と同様ですが、プロパー均衡では、そのような非合理的な行動の中でも、プレーヤーにとってより大きな損失を招く可能性のある行動が選択される確率は、小さな損失で済む行動に比べて極めて低いと仮定する点に特徴があります。この確率の大小関係に厳密な順序を与えることで、より現実的で説得力のあるゲームの解を予測しようとします。
定義
プロパー均衡を定義するためには、「ε-プロパー戦略プロファイル」という中間概念が必要です。ある標準形ゲームにおいて、正の小さなパラメータεを考えます。完全混合戦略プロファイルσがε-プロパーであるとは、どのプレーヤーiについても、ある純粋戦略sを選ぶことによる期待利得が、別の純粋戦略s'を選ぶことによる期待利得よりも小さい(すなわち、戦略sが戦略s'よりも不利である)場合、不利な戦略sに割り当てられる確率が、より有利な戦略s'に割り当てられる確率のε倍以下である、という条件を満たすことをいいます。これは、たとえ非合理的な行動をとる可能性があっても、より不利な行動はより有利な行動に比べて圧倒的に起こりにくい、という仮定を
数学的に表現したものです。
ゲームの戦略プロファイルがプロパー均衡であるとは、それが、ε-プロパーな戦略プロファイルの列を考えたときに、パラメータεを限りなくゼロに近づけた極限として得られる戦略プロファイルである、と定義されます。この極限操作を通じて、最終的には非合理的な行動をとる確率はゼロになりますが、εがゼロに近づく際の相対的な確率の大きさの関係が、最終的な均衡戦略を決定する上で重要な役割を果たします。
例:マッチングペニーの変種
プロパー均衡の考え方を具体的に理解するため、マッチングペニーと呼ばれるゲームの変種を例に取ります。
このゲームには2人のプレーヤーがいます。プレーヤー1は硬貨の表か裏のいずれかを隠します。プレーヤー2は、プレーヤー1が隠した面が表か裏かを推測するか、あるいは推測せずに無条件でペニーを「強奪」するかの3つの選択肢を持ちます。プレーヤー2が推測を当てればペニーを獲得し、外せば何も得られません。強奪を選んだ場合、プレーヤー1が表裏どちらを隠したかに関わらず、プレーヤー2はペニーを獲得できます。
このゲームのナッシュ均衡を分析すると、プレーヤー2が「強奪」を選択することが常に最適であることがわかります。プレーヤー2が確率1で強奪を選ぶ戦略に対して、プレーヤー1は表を選んでも裏を選んでも結果は同じため、プレーヤー1の任意の混合戦略(表と裏をどんな確率で選ぶか)が最適反応となります。したがって、「プレーヤー2は強奪を選び、プレーヤー1は任意の混合戦略をとる」という戦略プロファイルは、すべてこのゲームのナッシュ均衡となります。
さらに、これらのナッシュ均衡は摂動完全均衡でもあります。これは、プレーヤー1が、プレーヤー2がほぼ確実に強奪してくるだろうと予想するため、自分が表を出すか裏を出すかによってプレーヤー2を不確かな状態に置くこと(マッチングペニー本来の目的)に価値を見出さないという直観に対応します。
しかし、プロパー均衡としてこのゲームを分析すると、一意なプロパー均衡が存在することが明らかになります。それは、プレーヤー1が表と裏をそれぞれ確率1/2で選び、プレーヤー2が「強奪」を確率1で選ぶという戦略プロファイルです。プロパー均衡では、なぜプレーヤー1は確率1/2ずつで表裏を選ぶのでしょうか?
プロパー均衡の考え方に基づけば、プレーヤー1はプレーヤー2が強奪を選ぶ可能性が極めて高いと予想しつつも、「万が一」プレーヤー2が推測を選ぶという、確率が非常に低い非合理的な行動をとった場合に備えます。プレーヤー2が推測を選んだ場合、プレーヤー1としては、プレーヤー2がどちらを推測しても当たる確率が50%になるように、自分が表と裏をそれぞれ確率1/2で出すのが、最も損失を抑えられる(または得るものが最大になる)備えとなります。プロパー均衡は、このような極めて低い確率で起こりうる可能性への備えが、最終的な均衡戦略に影響を与えうることを示しているのです。この例では、プレーヤー1の「震え」(プレーヤー2が推測を選ぶ可能性)に対する合理的な対応が、最終的なプロパー均衡においてプレーヤー1が確率1/2ずつで戦略を選ぶ結果をもたらしています。
展開形ゲームにおけるプロパー均衡
ゲームが手順を追って進行する展開形ゲーム(Extensive Form Game)においても、プロパー均衡の概念を応用するいくつかの方法があります。摂動完全均衡と同様に、展開形ゲームにプロパー性を適用する際には異なるアプローチが考えられます。その一つに、展開形ゲームをまず標準形ゲームに変換し、その標準形ゲームのプロパー均衡を求める方法があります。この方法で得られる均衡は「正規形プロパー均衡」と呼ばれます。興味深いことに、エリック・ヴァン・ダムの研究により、この正規形プロパー均衡は、展開形ゲームにおける別の重要な均衡概念である「
準完全均衡(Quasi-perfect Equilibrium)」と行動的に等価であることが示されています。これは、異なる視点から定義された均衡概念が、特定の条件下で同じ行動予測をもたらすことを示唆する結果です。
プロパー均衡は、プレーヤーの合理性を基本としながらも、わずかな非合理性やミスの可能性をモデルに組み込むことで、ナッシュ均衡や摂動完全均衡では捉えきれない、より精緻で説得力のあるゲームの解を導き出すための強力な分析ツールとして位置づけられています。