支配戦略

支配戦略(dominant strategy)



ゲーム理論における「支配戦略」とは、あるプレイヤーが持つ戦略のうち、他のプレイヤーがどのような戦略を選んだとしても、自身の他のどの戦略を選んだ場合と比較しても、最も高い利得(報酬や結果)をもたらす、あるいはそれ以上の利得を保証する戦略を指します。これは、ゲームの状況においてプレイヤーが取るべき行動を考える上で非常に重要な概念です。

支配戦略に関連して、「支配関係」という概念があります。これは、同じプレイヤーが持つ二つの戦略を比較した際の関係です。ある戦略が別の戦略よりも、他のプレイヤーのすべての可能な戦略の組み合わせに対して、より高い利得をもたらす、あるいは少なくとも同等以上の利得をもたらす場合に、一方の戦略が他方を「支配する」といいます。

支配関係の種類



支配関係には主に二つの種類があります。

弱支配(weak dominance):戦略Aが戦略Bを弱支配するとは、他のプレイヤーのどの戦略の組み合わせに対しても、戦略Aによる利得が戦略Bによる利得以上であり、かつ少なくとも一つの組み合わせに対しては、戦略Aによる利得が戦略Bによる利得よりも厳密に高くなる場合を指します。
強支配(strict dominance):戦略Aが戦略Bを強支配するとは、他のプレイヤーのどの戦略の組み合わせに対しても、戦略Aによる利得が戦略Bによる利得よりも厳密に高くなる場合を指します。

支配戦略の定義



上記の支配関係を用いて、支配戦略は以下のように定義されます。

弱支配戦略(weakly dominant strategy):あるプレイヤーの戦略が、自身の他のすべての戦略を弱支配する場合、その戦略を弱支配戦略といいます。
強支配戦略(strictly dominant strategy):あるプレイヤーの戦略が、自身の他のすべての戦略を強支配する場合、その戦略を強支配戦略といいます。

支配される戦略



逆に、あるプレイヤーの戦略が他のある戦略に弱支配される場合、それを「弱支配される戦略」と呼びます。同様に、他のある戦略に強支配される場合、「強支配される戦略」と呼びます。

合理性と支配戦略



ゲーム理論において、プレイヤーが「合理的」であるとは、自身にとって明らかに不利な戦略、すなわち「強支配される戦略」を決して選択しないことを意味します。もし、ゲームに参加するすべてのプレイヤーがそれぞれ強支配戦略を持っており、かつ全員が合理的であるならば、プレイヤーたちはそれぞれの強支配戦略を選択すると予測されます。この、すべてのプレイヤーが強支配戦略を選択した結果得られる戦略の組み合わせを「支配戦略均衡(dominant strategy equilibrium)」と呼びます。支配戦略均衡が存在するゲームでは、プレイヤーが合理的であるという前提のもと、この均衡状態が実現すると考えられます。

ただし、支配戦略均衡は必ずしも社会全体にとって最も望ましい結果(パレート効率的)であるとは限りません。「囚人のジレンマ」は、個々のプレイヤーにとって合理的な行動(自白)が強支配戦略となり、その結果到達する支配戦略均衡が、全員が黙秘した場合よりもパレート効率的でない、という典型的な例です。

最適反応およびナッシュ均衡との関連



ある戦略プロファイル(各プレイヤーの戦略の組み合わせ)に対する「最適反応」となる戦略は、それ自体が強支配されることはありません。したがって、ゲームにおける最も有名な解概念である「ナッシュ均衡」を構成する戦略も、決して強支配されることはありません。

さらに、すべてのプレイヤーが混合戦略(複数の戦略を確率的に選択すること)を用いる戦略プロファイルに対する最適反応は、弱支配されることもありません。また、弱支配されない戦略だけで構成されるナッシュ均衡は、どのような戦略型ゲームにも必ず存在することが知られています。

強支配される戦略の繰り返し消去(Iterated Elimination of Strictly Dominated Strategies: IESDS)



強支配される戦略の繰り返し消去は、ゲームの解を導くための基本的な手法の一つです。これは、ゲームから強支配される戦略を順次取り除いていくプロセスです。

具体的な手順は以下のようになります。
1. まず、元のゲームにおいて強支配される戦略を特定し、それらをゲームから除外します。
2. 次に、残った戦略の集合の中で、再度強支配される戦略を特定し、これも除外します。
3. このプロセスを、もはや強支配される戦略が存在しなくなるまで繰り返します。

ゲームが有限である(プレイヤーの数と各プレイヤーの戦略の数が有限である)場合、このプロセスは必ず有限回で終了し、最終的にいくつかの戦略が残ります。この最終的に残った戦略は、「反復的に強支配されない戦略」と呼ばれます。

IESDSの興味深い点は、どのプレイヤーから戦略を消去しても、あるいは一度にすべてのプレイヤーの強支配される戦略を消去しても、最終的に残る戦略の集合は同じになるという性質を持っていることです。ただし、この手順によって求められる解が実現するためには、すべてのプレイヤーが合理的であることだけでなく、「すべてのプレイヤーが合理的であるという事実が、ゲームに参加する全員に知られている(共有知識である)」という、より強い合理性の仮定が必要となります。

なお、同様の繰り返し消去を「弱支配される戦略」に対して行うことも可能ですが、その場合は最終的に残る戦略の集合が消去の順序によって変わる可能性があり、また、本来存在するはずのナッシュ均衡の一部が消去されてしまう可能性もあるため、IESDSほど一般的に用いられる解法ではありません。

注意点として、ある純粋戦略(特定の行動を確率1で選択する戦略)が他のどの純粋戦略にも強支配されないからといって、その純粋戦略が混合戦略も含めたあらゆる戦略に対して強支配されないとは限りません。例えば、ある純粋戦略が、他の二つの純粋戦略をそれぞれ確率50%で選択する混合戦略に強支配される、といったケースも存在します。

支配戦略やそれに関連する概念は、ゲーム理論におけるプレイヤーの行動予測やゲームの分析を行う上で、非常に基礎的かつ強力なツールとなります。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。