合理化可能性

合理化可能性



概要


ゲーム理論における合理化可能性(rationalisability)は、複数のプレーヤーが互いの合理性を認識し、ゲームの構造に関する共通の理解を持っている状況下で、各プレーヤーが選択しうる戦略の集合を特定するための解概念です。これは、広く知られているナッシュ均衡をより一般化した考え方として位置づけられます。合理化可能性の考え方は、デビッド・バーンハイムとダグラス・ピアースによって独立に提唱されました。

合理化可能性の中心的なアイデアは、決してどの相手戦略に対しても最適反応とならないような戦略を、ゲームの構造とプレーヤーの合理性に関する共有知識に基づいて繰り返し排除していくプロセスに基づいています。この消去プロセスを生き残った戦略こそが、合理化可能であるとされます。

定義とプロセス


合理化可能戦略は、以下の逐次的な消去プロセスを経て定義されます。

1. 最初に、各プレーヤーの利用可能な戦略集合全体を初期の集合とします。
2. 各ステップにおいて、前のステップで生き残った戦略の組み合わせに対して、決して最適反応とならない戦略を排除します。
3. この排除プロセスを、それ以上戦略が排除されなくなるまで繰り返します。

このプロセスを無限回繰り返した結果、最終的に残った戦略の集合が、そのプレーヤーの合理化可能戦略の集合となります。数学的には、各ステップで残る戦略集合を再帰的に定義し、その無限回の共通部分として合理化可能戦略の集合が得られます。この定義では、プレーヤーは相手プレーヤーが前のステップで残った戦略集合の凸包(混合戦略を含む概念)から戦略を選択すると予想しうると仮定します。

基礎となる仮定と関連用語


合理化可能性の概念は、プレーヤーの行動に関する以下の基本的な仮定に基づいています。

予想(信念): 各プレーヤーは、他のプレーヤーがどのような戦略を選択するかについて、確率的な予想(信念)を持っています。
合理的なプレーヤー: 合理的なプレーヤーは、自身の予想のもとで自己の利得を最大化する最適反応となる戦略のみを選択します。
最適反応: あるプレーヤーの戦略が、相手プレーヤーの特定の戦略の組み合わせ(または混合戦略)に対する最適反応であるとは、その相手戦略に対して他のどの戦略を選択しても、そのプレーヤーの利得が最適戦略を選択した場合の利得を下回らないことを意味します。
合理性に関する共有知識: 全員が合理的であるという事実が、全員によって知られており、さらにそれが全員に知られていることが全員に知られている、といったように無限に繰り返される状態です。これは、プレーヤーが自身の合理性だけでなく、他のプレーヤーも合理的であると推論し、さらにその推論のプロセスも共有されていることを意味します。

合理性共有知識がある場合、プレーヤーは他のプレーヤーもまた合理的な推論プロセスを経て戦略を選択すると考えます。これにより、決して最適反応にならない戦略を排除するプロセスが正当化されます。

主要な結果


合理化可能性に関する重要な結果として、以下の点が挙げられます。

ある戦略が合理化可能であることと、他の合理化可能戦略の集合に対する最適反応であることは同値です。
ナッシュ均衡を構成する各戦略は、必ず合理化可能です。これは、ナッシュ均衡が相互に最適反応である戦略の組み合わせであるため、逐次的な排除プロセスを生き残るからです。

合理化可能性に基づく予測は、ナッシュ均衡の予測よりも広範になる傾向があります。

繰りかえし強支配との関係



2人ゲームの場合


2人ゲームにおいては、合理化可能性と繰りかえし強支配戦略の逐次消去(Iterated Elimination of Strictly Dominated Strategies; IESDS)の結果生き残る戦略集合は等価であることが示されています。繰りかえし強支配は、いかなる状況でも常に他の戦略より悪い結果をもたらす(強く支配される)戦略を繰り返し排除していくプロセスです。合理的なプレーヤーは強く支配される戦略を決して選択しないという前提に基づいています。2人ゲームでは、「強く支配される」戦略は必ず「決して最適反応にならない」戦略であり、その逆も成立するため、両者は同値となります。

多人数ゲームの場合


しかし、3人以上の多人数ゲームでは、合理化可能性と繰りかえし強支配は必ずしも同値ではありません。これは、多人数ゲームでは、ある戦略が「決して最適反応にならない」としても、それが「強く支配される」戦略であるとは限らない状況が生じうるためです。特に、プレーヤーが他のプレーヤーたちが独立に戦略を選択すると予想する場合(独立な混合戦略に対する最適反応を考える場合)にこの違いが現れます。

ナッシュ均衡との関係性


ナッシュ均衡は常に合理化可能戦略の組み合わせですが、合理化可能戦略の組み合わせが必ずしもナッシュ均衡になるとは限りません。ナッシュ均衡では、各プレーヤーの戦略選択が相互の予想と整合的であることが求められます。つまり、プレーヤーiがプレーヤーjの戦略sjを予想して自身の最適戦略siを選択し、かつプレーヤーjがプレーヤーiのsiを正しく予想しているならば、sjがその予想に対して最適になっている、というような信念の整合性が必要です。

一方、合理化可能性は、各プレーヤーが他のプレーヤーは合理的であるという信念を持ち、その信念に基づいて最適反応を選択するというプロセスに基づきますが、プレーヤー間の個々の予想が互いに整合的であることまでは要求しません。したがって、合理化可能性によって特定される戦略の組み合わせの中には、少なくとも一人のプレーヤーの予想が外れているものが含まれる可能性があります。例えば、「男女の争い」のようなゲームでは、合理化可能性は複数の結末(ナッシュ均衡以外のものも含む)を許容することがあります。これは、プレーヤーの個別の予想が共有知識となっていないことに起因します。

他の解概念との関連


合理化可能性は、相関均衡や主観的相関均衡とも関連があります。特に、2人ゲームにおける合理化可能戦略の集合は、プレーヤー間の事前の予想が一致している必要がない主観的相関均衡と等価であることが示されています。

論争


合理化可能性は、ナッシュ均衡の予測範囲を狭める支配戦略の排除といった概念よりも、しばしば多くの戦略を許容します。そのため、合理化可能性だけではゲームの予測力が限定的であり、多くの合理化可能な結末の中からどの結果が実現するかを峻別する手法としては弱いという批判もあります。

ゲーム理論における合理化可能性は、プレーヤーの合理性と知識の共有に関する仮定に基づき、より広い範囲の行動を説明しようとする重要な概念です。ナッシュ均衡よりも弱い予測を与えますが、プレーヤーの個別の推論プロセスや信念構造を理解する上で有用な枠組みを提供します。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。