ベイジアンゲーム(Bayesian game)は、ゲーム理論において、参加プレイヤーの一部が他のプレイヤーの特性(例えば、利得関数など)について完全な情報を持っていない状況を扱うモデルです。このような「情報の不完備性」が存在するゲームでは、プレイヤーは自身が知っている情報と、他のプレイヤーの未知の特性に関する自身の「信念」(確率分布)に基づき、合理的な行動を決定します。
この概念は、
ジョン・ハーサニ(John Harsanyi)によって確立されました。ハーサニの枠組みでは、ベイジアンゲームは、ゲームに「自然」(Nature)という仮想的なプレイヤーを導入することでモデル化されます。自然は、各プレイヤーにそのプレイヤーの「タイプ」を確率的に割り当てます。プレイヤーのタイプは、そのプレイヤーの利得関数など、ゲームにおけるそのプレイヤーの属性を決定します。これにより、情報の不完備なゲームは、ゲームの歴史(過去の行動や出来事)の一部がプレイヤーにとって不明である「不
完全情報ゲーム」へと変換されます。プレイヤーは他のプレイヤーのタイプに関する事前の信念を持ち、ゲームの進行に伴って観察される行動に基づき、ベイズルールに従ってその信念を更新していきます。
静的な
完備情報ゲームを正規形で表現する場合、プレイヤーの戦略空間と利得関数が定義されます。戦略とは、ゲームで想定されるあらゆる状況下での行動計画全体を指します。利得関数は、全プレイヤーの戦略の組み合わせ(戦略プロファイル)に対して、各プレイヤーが得る利得を対応させます。
ベイジアンゲームを特徴づけるには、各プレイヤーについて、通常の戦略空間に加え、「タイプ空間」(とりうるタイプ全ての集合)、「利得関数」(戦略プロファイルとタイププロファイルに依存)、そして「信念」(他のプレイヤーのタイプに関する条件付き確率分布)を明確に定義する必要があります。ここでいうプレイヤーの戦略は、自身がどのようなタイプであっても、想定されるあらゆる状況に対応できる包括的な行動計画でなければなりません。他のプレイヤーのタイプが不明であるため、自身のタイプに応じて最も有利になるように行動を計画します。各プレイヤーの信念は、自身のタイプが特定されたもとで、他のプレイヤーがどのようなタイプであるかについての確率的な推測を表します。
形式的には、ベイジアンゲームは、プレイヤー集合、自然の状態集合、各プレイヤーの行動集合、タイプ集合、タイプを決定する関数、タイプと行動の制約、各プレイヤーの利得関数、自然の状態に関する各プレイヤーの信念(確率分布)によって定義されます。プレイヤーの戦略は、自身のタイプのみに依存して行動を選択する関数となります。この枠組みのもとで、各プレイヤーは他のプレイヤーの戦略と自身の信念を考慮し、自身の期待利得を最大化する戦略を選択しようとします。
ベイジアンゲームの応用例として、
シグナリングゲームがあります。これは、一方のプレイヤー(エージェント)が自身のタイプを知っているが、他方のプレイヤー(プリンシパル)はエージェントのタイプを知らないという非対称な情報を持つゲームです。エージェントは自身のタイプを示すような行動(シグナル)を取り、プリンシパルはそのシグナルを観察してエージェントのタイプを推測し、自身の行動を決定します。
典型的な例として、労働市場における求職者(エージェント)と雇用者(プリンシパル)のモデルが挙げられます。求職者には有能なタイプと無能なタイプがいますが、雇用者は事前にどちらかを知りません。求職者が大学教育を受けるという行動は、自身の能力を示すシグナルとなり得ます。例えば、有能なタイプにとって大学教育のコストは低いが、無能なタイプにとっては高いと仮定すると、雇用者は大学教育を受けた求職者は有能である可能性が高いと推測できます。この推測に基づき、雇用者はより高い賃金を提示する戦略を取るかもしれません。このような状況で、有能な求職者のみが大学に進学し、無能な求職者は進学しないことでタイプが区別される均衡は「分離均衡」と呼ばれます。
ベイジアンゲームにおける解の概念として、
ベイジアン・ナッシュ均衡があります。これは、各プレイヤーが他のプレイヤーの戦略と、自身の他のプレイヤーのタイプに関する信念を所与として、自身の期待利得を最大化する戦略プロファイルと信念の組み合わせです。静的なベイジアンゲームにおいては有効な
解概念ですが、手番が逐次的に進行する動的なゲームにおいては、非合理的な行動に基づく均衡が含まれてしまう可能性があります。これは、完全・
完備情報ゲームにおける
部分ゲーム完全均衡でないナッシュ均衡が非合理的であるのと同様の問題です。
動的な
不完備情報ゲームにおけるより精緻な
解概念として、
完全ベイズ均衡があります。ベイジアン・ナッシュ均衡や部分ゲーム完全性の概念だけでは排除できない非合理な均衡を排除するために導入されました。完全ベイズ均衡では、ゲームの進行中にプレイヤーが直面する「
情報集合」(プレイヤーが自身のタイプやこれまでのゲームの展開について不確実性を持つ状態)において、プレイヤーが持つ他のプレイヤーのタイプやゲームの状態に関する「信念の体系」が重要になります。信念の体系は、各
情報集合内の可能な状態(ノード)に対して確率分布を割り当てるものです。
完全ベイズ均衡は、戦略プロファイルと信念の体系の組み合わせであって、以下の二つの条件を満たすものを指します。
1.
逐次合理性: プレイヤーが手番を持つ任意の
情報集合において、その
情報集合における自身の信念に基づき、その時点からの続きのゲームでの期待利得を最大化する行動を選択している。
2.
整合性: 信念の体系が、均衡戦略プロファイルを所与としてベイズルールを用いて計算される確率と一致している。ただし、均衡経路外の
情報集合(均衡戦略プロファイルでは到達しない
情報集合)では、ベイズルールが適用できないため、整合性の条件は到達可能な
情報集合に対して適用されるか、より強い整合性概念が用いられます。
完全ベイズ均衡は、プレイヤーの信念と行動の相互関係をより厳密に捉えることで、動的な
不完備情報ゲームにおける合理的な予測を提供する強力なツールとなっています。