ゲーム理論における「解概念」(かいがいねん、英: solutions concept)は、プレイヤー間の相互作用によって進行するゲームにおいて、プレイヤーたちがどのような戦略を選択し、その結果としてどのような結末に至るかを予測するための形式的な手法です。この予測された結果や戦略の組み合わせを「解」と呼びます。ゲーム理論の研究では、この解概念を用いることで、特定の状況下での合理的なプレイヤーの行動様式を分析し、ゲームの様々な結果を理解しようと試みます。最も広く知られている解概念の一つに、ナッシュ
均衡があります。
多くのゲームでは、一つの解概念を用いても複数の「解」が存在することがあり、そのどれが実際に実現するか不確かになる場合があります。こうした状況に対処するため、ゲーム理論家は「精緻化」(refinement)と呼ばれる手法を用いて、複数存在する解の中から、より現実的で説得力のあるものを絞り込もうとします。以下に述べる解概念は、内容がより詳細なゲームにおいて、非現実的な予測を排除することで、先行する概念を改善・発展させたものとして順に提示されることが多いです。
形式的な定義
数学的には、解概念は、あらゆるゲームの集合に対し、それぞれのゲームの戦略プロファイルの集合の部分集合を対応させる関数として定義されます。これは、特定のゲームに対して、考えられる戦略プロファイルの中から「解」と見なされるものだけを選び出す操作と理解できます。
この考え方では、ゲームに参加するプレイヤーは合理的であると仮定します。合理的なプレイヤーは、決して「強く支配される戦略」を選択しません。ある戦略が強く支配されるとは、他のプレイヤーがどのような戦略をとるかにかかわらず、常にそれよりも高い利得をもたらす別の戦略が存在する場合を指します。したがって、強く支配される戦略は予測される行動の候補から排除されます。例えば、典型的な「
囚人のジレンマ」ゲームでは、どちらのプレイヤーにとっても「協力」という戦略は「裏切り」という戦略に強く支配されています。これは、相手が協力しても裏切りを選んでも、「裏切り」を選んだ方が常に高い(あるいは等しい)利得が得られるためです。
ナッシュ
均衡は、ゲーム理論において最も基本的で広く用いられる解概念です。これは、各プレイヤーの戦略が、他のすべてのプレイヤーが選んだ戦略に対する「最適反応」となっているような戦略プロファイルの組み合わせを指します。戦略プロファイルとは、ゲームに参加する全プレイヤーの戦略を同時に指定したものです。あるプレイヤーの戦略が他のプレイヤーの戦略に対する最適反応であるとは、他のプレイヤーの戦略が固定されていると仮定した場合、そのプレイヤーにとって他のどの戦略を選んでも、現在の戦略よりも高い利得が得られない状態を意味します。ナッシュ
均衡では、どのプレイヤーも相手の戦略を知っているとすれば、自分の戦略を一方的に変更する動機を持たないため、安定した予測として注目されます。
後ろ向き帰納法
ナッシュ
均衡は強力な概念ですが、特に時間とともに進行する「動学ゲーム」においては、非現実的な結果を予測してしまうことがあります。こうした非現実的なナッシュ
均衡は、「後ろ向き帰納法」(backward induction)という手法を用いることで排除できる場合があります。この手法では、ゲームの最終段階から遡って、各段階でプレイヤーが合理的な選択をすると仮定して行動を決定します。これにより、「信用できない脅し」(credible threat)ではない行動に基づくナッシュ
均衡が排除されます。信用できない脅しとは、プレイヤーが実際にその状況に直面した際に、実行することが非合理になるような約束や行動方針のことです。例えば、ある既存企業と新規参入企業を想定したゲームでは、参入された場合に既存企業が「価格競争で徹底的に対抗する」と脅すナッシュ
均衡が存在し得ますが、実際に参入された段階で対抗することが(価格競争による利潤の低下などから)既存企業にとって非合理であれば、その脅しは信用できず、後ろ向き帰納法によって排除されるべき予測となります。後ろ向き帰納法は、主に有限のステップで終了する
完全情報ゲームに適用可能です。
部分ゲーム完全均衡
後ろ向き帰納法は特定のタイプのゲームに限定されるため、その一般化として「部分ゲーム完全
均衡」(subgame perfect equilibrium)という概念が導入されました。この概念では、ゲーム全体がナッシュ
均衡であることに加え、ゲームの途中から始まるあらゆる「部分ゲーム」においても、そこで行われるプレーがナッシュ
均衡となっていることを要求します。これにより、ゲームのどの時点から見ても合理的な行動が予測されるようになります。後ろ向き帰納法は
完全情報ゲームの特定クラスにのみ有効ですが、部分ゲーム完全
均衡は不
完全情報ゲームを含むより広いクラスのゲームに適用できます。後ろ向き帰納法によって排除されるナッシュ
均衡は、通常、ある部分ゲームにおいてナッシュ
均衡となっていないため、部分ゲーム完全
均衡の条件を満たしません。
完全ベイズ均衡
部分ゲーム完全
均衡でも、プレイヤーが持つ「情報」が不完全なゲーム(不
完全情報ゲーム)においては、非現実的な結果を十分に排除できない場合があります。特に、プレイヤーが他のプレイヤーのタイプ(能力や好みなど)を知らない場合などに問題が生じます。これを克服するため、「完全ベイズ
均衡」(perfect Bayesian equilibrium: PBE)という概念が提案されました。完全ベイズ
均衡は、プレイヤーの「戦略」だけでなく、「信念」をも明示的に考慮します。信念とは、プレイヤーがゲームの特定の時点で、自分が
情報集合のどの点にいるか、あるいは他のプレイヤーがどのようなタイプであるかなどについて持つ確率的な推測です。完全ベイズ
均衡では、プレイヤーの戦略は、その信念を所与として合理的である(期待利得を最大化する)こと、そしてプレイヤーの信念は、観察された他のプレイヤーの戦略や行動と整合的であること(通常、
ベイズの定理を用いて更新される)が求められます。また、完全ベイズ
均衡では、たとえ実際に実現する可能性が低い「
均衡経路外」の
情報集合においても、プレイヤーの戦略が強く支配されていないことが要求されます。これにより、非現実的な仮定に基づいた行動を予測から排除します。
前向き帰納法
後ろ向き帰納法が将来のプレーにおける合理性を仮定するのに対して、「前向き帰納法」(forward induction)は、プレイヤーが過去の行動が合理的に選択されたものであると推測するという考え方に基づいています。特に不
完全情報ゲームにおいて、プレイヤーは他のプレイヤーの観察された行動から、そのプレイヤーのタイプに関する信念を形成します。このように、過去の合理的な行動から相手の意図や特性を推測し、それに基づいて自身の戦略を決定するというプロセスが前向き帰納法のエッセンスです。プレイヤーは、自分の行動を通じて相手に自身のタイプや意図に関する「シグナル」を送ることを選択するかもしれません。
安定均衡とメルタン安定均衡
前向き帰納法の考え方を厳密に定式化する試みとして、コールバーグとメルタン(Kohlberg and Mertens)によって「安定
均衡」(stable equilibrium)の概念が導入されました。これは、ある種の「摂動」(わずかな不確実性や非合理性)に対する頑健性を持つ
均衡として定義され、前向き帰納法を満たす精緻化と考えられました。しかし、安定
均衡が必ずしも後ろ向き帰納法を満たさない反例が発見されたため、ジャン=フランソワ・メルタンは後に「メルタン安定
均衡」(Mertens stable equilibrium)という概念を提案しました。これはおそらく、前向き帰納法と後ろ向き帰納法の両方の要請を満たす最初の解概念であるとされています。
これらの解概念は、ゲームの構造や情報量に応じて適切な予測を行うために発展してきました。ナッシュ
均衡を基礎としつつ、より複雑な状況や非現実的な予測を排除するための様々な精緻化が考案され、ゲーム理論による現実世界や経済現象の分析精度向上に貢献しています。