Ε均衡

ε均衡(イプシロンきんこう)は、ゲーム理論における重要な概念の一つであり、「近似ナッシュ均衡」とも呼ばれます。これは、広く知られているナッシュ均衡の定義を少しだけ緩めたものです。ナッシュ均衡が理論上、あるいは計算上見つけにくい場合に、その代わりに用いられることがあります。

定義



ゲーム理論では、複数のプレイヤーが互いの行動を考慮しながら自身の戦略を決定します。プレイヤーたちが選ぶ戦略の組み合わせ全体を「戦略プロファイル」と呼び、それぞれの戦略プロファイルに対して各プレイヤーが得る結果(利得)が定められています。

ナッシュ均衡とは、ある戦略プロファイルが与えられたとき、どのプレイヤーも他のプレイヤーの戦略が変わらないと仮定するならば、自分自身の戦略を他のものに変更しても、現在の利得を増やすことができない状態を指します。つまり、全員が現状の戦略に満足している状態です。

一方、ε均衡は、このナッシュ均衡の条件を、非負の実数である小さな値 ε(イプシロン)を用いて近似的に考える概念です。ある戦略プロファイルがε均衡であるとは、どのプレイヤーについても、自分だけの戦略を他のものに変更しても、得られる期待利得が、現在の期待利得にεを加えた値を超えるほど大きくならない状態を言います。

より厳密に言うと、プレイヤー i の戦略を σ_i、他のプレイヤーたちの戦略を σ_{-i} とし、戦略プロファイル σ = (σ_i, σ_{-i}) におけるプレイヤー i の期待利得を u_i(σ) とします。ε均衡は、任意のプレイヤー i とその取りうる任意の戦略 σ_i' に対して、もしプレイヤー i が戦略を σ_i' に変更し、他のプレイヤーは σ_{-i} のままであった場合の期待利得 u_i(σ_i', σ_{-i}) が、現在の期待利得 u_i(σ) から ε を引いた値を下回らない(つまり u_i(σ) ≥ u_i(σ_i', σ_{-i}) - ε)という条件が成り立つ戦略プロファイル σ を指します。

ナッシュ均衡との関連



ε均衡は、ナッシュ均衡を包含する概念です。具体的には、ε = 0 とした場合のε均衡は、厳密な意味でのナッシュ均衡に等しくなります。ナッシュ均衡では戦略変更による利得改善が全く許されないのに対し、ε均衡ではε以下のわずかな改善の可能性は許容されるため、より広い範囲の戦略プロファイルが均衡と見なされる可能性があります。

なぜε均衡が重要か



ε均衡の概念は、ナッシュ均衡が理論上存在しないゲームや、存在しても計算が非常に困難な複雑なゲームを分析する際に、特に有用となります。無限に続く確率ゲームなどでは、ナッシュ均衡が存在しないことがありますが、ε均衡ならば存在する場合が多いです。これにより、特定のゲームにおける安定した、あるいはほぼ安定した戦略の組み合わせを特定することが可能になります。

具体的な例



ナッシュ均衡が存在しないゲーム: 無限に続く確率ゲームの中には、単純なルールにも関わらずナッシュ均衡が存在しない例があります。エヴェレットが考案したマッチングペニーの変種はその一例です。このゲームでは、プレイヤー1が硬貨を隠し、プレイヤー2が表か裏かを推測します。当てればプレイヤー2の勝ちで終了。表と推測して外れればゲーム終了、裏と推測して外れればゲーム続行です。このゲームにはナッシュ均衡は存在しません。しかし、もしプレイヤー2が、ゲームのどの時点においても、確率εで表を、確率1-εで裏を推測するという戦略をとるとすれば、この戦略プロファイルは任意の ε > 0 に対してε均衡になります。プレイヤー1がどんな戦略を選んでも、プレイヤー2がこの戦略から逸脱したとしても、期待利得はε以上には改善されないからです。

繰り返しゲーム: 有名な「囚人のジレンマ」ゲームを、例えば T 回のような有限の期間繰り返す場合を考え、プレイヤーの利得を全期間の平均とします。この繰り返しゲームの唯一のナッシュ均衡は、各期間で両プレイヤーが常に「裏切り」を選択するというものです。しかし、実際の状況では「しっぺ返し戦略」(最初は協調し、その後は相手の前回の行動を模倣する)や「グリムトリガー戦略」(最初は協調し、一度でも相手が裏切ったら以後は常に裏切る)といった、ある程度の協調を含む戦略が見られることがあります。これらの戦略は厳密なナッシュ均衡ではありませんが、Tが十分に大きい場合、適切なεの値に対してε均衡になり得ます。これは、これらの戦略からわずかに逸脱しても、短期的な利得の増加がεの範囲に収まり、長期的な協調の維持による恩恵がそれを上回る可能性があるためです。

* 経済学での応用: 経済学モデル、特に多数のプレイヤーがいる場合や混合戦略が現実的でないと見なされる文脈で、ε均衡が用いられることがあります。例えば、複数の企業が価格競争を行うベルトラン・エッジワースモデルでは、純粋戦略ナッシュ均衡が存在しないことがあります。こうしたケースで、「純粋戦略ε均衡」の概念が使われることがあります。これは、各プレイヤーが、最適な純粋戦略から「εの範囲内でずれている」純粋戦略を選択する状態をモデル化するものです。

ε均衡は、ナッシュ均衡の概念を補完し、より広範なゲームや現実世界の複雑な状況を分析するための柔軟で強力なツールとして、ゲーム理論や経済学の様々な分野で活用されています。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。