自己確証均衡と整合的自己確証均衡
自己確証均衡(Self-Confirming Equilibrium)は、ゲーム理論、特に
展開型ゲームにおける
ナッシュ均衡概念の
一般化の一つです。この概念は、プレイヤーが実際の経験を通じて学習するという観点に基づいています。
自己確証均衡の核心は、プレイヤーが
実際に観測する他のプレイヤーの行動については
正しい予測を持つ一方で、ゲームの進行において
決して到達しないような状況(
情報集合)における相手の行動については、
誤った信念を持っていても構わないという点にあります。
より具体的には、各プレイヤーは自身の持つ信念に基づいて最適な戦略を選択します。この戦略の組み合わせによって実際にゲームが進行する経路(
均衡経路)上で、他のプレイヤーたちの実際の行動が、各プレイヤー自身の予測と
一致することが要請されます。これは、プレイヤーが実際に経験する(均衡経路上の)事柄のみから学び、その経験が自身の予測と矛盾しない限り、信念を維持するという考え方に基づいています。ゲームが繰り返し行われる際に、もしプレイヤーが自身の信念を改訂するとすれば、それは観測された結果が自身の予測と異なった、すなわち信念が誤っていたと気づいた時だけである、というアイデアが背景にあります。自己確証均衡では均衡経路上の予測が正しいため、信念の誤りを示すシグナルが発生せず、均衡経路上の信念は自己確証されます。しかし、均衡経路から外れた、実際に到達しない
情報集合での相手の行動については、プレイヤーは観測する機会がないため、誤った予測や信念を持ち続ける可能性があります。
整合的自己確証均衡(Consistent Self-Confirming Equilibrium)は、自己確証均衡をさらに
精緻化した均衡概念です。この概念は、プレイヤーたちが時折「気が狂った」かのように、通常とは異なる行動を取る相手に出会う可能性を考慮する
学習モデルに動機づけられています。
整合的自己確証均衡では、自己確証均衡が求める条件に加えて、より強い予測の一貫性が要求されます。すなわち、各プレイヤーは、
自分自身を除く他の全てのプレイヤーが均衡戦略から
逸脱した場合に到達しうる
全ての情報集合において、他のプレイヤーたちのプレー(取る行動の確率分布)について
正しい予測を持っている必要があるという制約が加わります。
このような厳しい条件は、プレイヤーが自身の均衡戦略に固執してプレイしていたとしても、他のプレイヤーの時折の逸脱によって様々な未到達の
情報集合を経験する機会を得るという状況を想定することで説明されます。十分な経験を通じて、プレイヤーは均衡経路以外の
情報集合における他のプレイヤーの行動パターン(確率分布)についても
学習し、正確な予測を持つようになる、という考えに基づいています。
結論として、整合的自己確証均衡は、自己確証均衡よりも強い予測の正確さを、特に未到達の
情報集合における予測に関して求めるため、その集合は自己確証均衡の集合の
真部分集合となります。これらの概念は、プレイヤーの学習や限定合理性を考慮した、より洗練されたゲーム分析に貢献しています。
参考文献
Drew Fudenberg and David K. Levine: "Self-confirming Equilibrium", Econometrica 61:523-545, 1993.