進化ゲーム理論
進化ゲーム理論は、
数学的なゲーム理論の枠組みを、
集団遺伝学や生態学における
個体群の振る舞いに適用することで発展した学問分野です。生物集団における戦略の進化や多様性の維持メカニズムを理解するために生まれ、後に
経済学や
政治学といった
社会科学分野にも影響を与えました。
従来の標準的なゲーム理論、特に非
協力ゲーム理論では、参加者(プレイヤー)は自身の利得関数を正確に理解し、最適な戦略を論理的に計算できる「合理的」な存在であると想定します。そして、繰り返し消去される戦略や、後ろ向き帰納法による均衡などを分析の対象とします。これに対し、進化ゲーム理論が焦点を当てるのは、必ずしも合理的思考を行わないプレイヤーの集団です。これらのプレイヤーは、ゲームの結果として得られた利得に基づき、時間の経過とともに自身の戦略を変化させていきます。この集団における戦略の分布がどのように移り変わっていくのかを、
力学系のアプローチを用いて分析するのが進化ゲーム理論の核心です。
歴史的背景
進化ゲーム理論の萌芽は、非
協力ゲーム理論の創始者である
ジョン・ナッシュが1950年の博士論文で示した、混合戦略ナッシュ均衡を「大衆行動」として解釈する考え方に見出せます。彼は、ゲーム構造の全体像を知らず、複雑な論理的思考も行わないプレイヤーたちが、経験を通じて得られた利得情報に基づいて戦略を選択する可能性を示唆していました。
その後、生物学の分野でこのアイデアが具体化します。
物理学をバックグラウンドに持つ
数理生物学者の
ジョン・メイナード=スミスと
集団遺伝学者のジョージ・プライスは、生物の闘争における戦略の安定性を研究し、1973年に「進化的に安定な戦略 (ESS: Evolutionarily Stable Strategy)」の概念を提唱しました。これが進化ゲーム理論の本格的な始まりとされています。続いて、1978年にはピーター・テイラーとレオ・ジョンカーが、自然選択による集団状態の変化を記述する「レプリケーターダイナミクス」を導入し、戦略の動的な安定性を分析しました。
1980年代後半に入ると、進化ゲーム理論の成果が
経済学や
政治学などの
社会科学分野に逆輸入され、非合理的な行動や学習プロセスに基づいた集団の動態を分析する強力なツールとして注目されるようになりました。1990年代以降は、試行錯誤や模倣といった単純な学習に加え、より複雑な学習メカニズムに基づく戦略分布の変化を分析する「学習ダイナミクス」や、
突然変異の役割を重視する「確率進化」、相互作用する相手がランダムではない状況を扱う「選択的相互作用」など、研究対象はさらに広がっています。
主要な概念
進化ゲーム理論の中心的な概念には、戦略の静的な安定性を示す「進化的に安定な戦略 (ESS)」と、戦略分布の動的な変化を記述する「レプリケーターダイナミクス」があります。これらは進化ゲーム理論における「車の両輪」とも言われます。
進化的に安定な戦略 (ESS)
ESSとは、ある戦略がその集団内のほぼ全ての個体によって採用されている状態(既存戦略)において、他のどんな戦略も、たとえ小規模な集団(変異体や侵入者)によって持ち込まれたとしても、既存戦略よりも期待利得が低くなり、集団内に広まることなく淘汰されてしまうような性質を持つ戦略を指します。これは、
適応度を利得と見なした場合、その戦略が
突然変異や外部からの小さな侵入に対して非常に頑健であることを意味します。ESSの概念には、侵入可能な割合の上限を示す「侵入障壁」や、その下限である「一様侵入障壁」といった関連する性質があります。また、ESSは局所的な範囲において、自身以外のどの戦略に対しても、相手よりも高い期待利得を得るという「局所的優越性」を持ちます。
ESSよりも条件を緩和した概念として、「中立安定戦略 (NSS)」や「均衡侵入に対して頑健な戦略 (REE)」などがあります。
中立安定戦略 (NSS): ESSが侵入戦略よりも厳密に高い利得を要求するのに対し、NSSは劣らなければよいとする戦略です。弱い意味での侵入障壁や局所的弱優越性を持ちます。
均衡侵入に対して頑健な戦略 (REE): 侵入後に最適な行動となる戦略からの侵入に対して頑健であるという性質を持ちます。これは特定の合理的な摂動に対する頑健性(プロパー均衡との関連)と結びついています。
レプリケーターダイナミクス
レプリケーターダイナミクスは、集団内の異なる戦略を採用する個体の割合(戦略分布)が、それぞれの戦略の平均利得(
適応度)に応じて時間とともにどのように変化していくかを記述する動的なモデルです。これは主に自然選択による集団構成の変化に焦点を当てており、戦略の
突然変異に注目したESSとは対照的な側面を持ちます。レプリケーターダイナミクスは、
個体群の増減を記述する一般化ロトカ・ヴォルテラ方程式と類似した形式で表されることがあります。
集団の状態を各純粋戦略を採用する個体の割合からなる確率分布として表現すると、レプリケーターダイナミクスは一連の
微分方程式(連続時間モデルの場合)や差分方程式(離散時間モデルの場合)として記述されます。これらの式は、戦略の利得が平均利得よりも高ければその戦略を採用する個体の割合が増加し、低ければ減少することを示しています。この動的なモデルを分析することで、集団の戦略分布がどのような均衡状態に向かうのか、またどのような状態が安定的に維持されるのかを調べることができます。例えば、連続時間モデルでは、反復強支配される戦略の割合はゼロに収束し、対称ナッシュ均衡点は定常状態となり、NSSは
リアプノフ安定、ESSは漸近安定となることが知られています。
離散時間モデルには、全ての個体が世代交代する「世代区分ダイナミクス」と、集団の一部が順次交代していく「世代重複ダイナミクス」などがあります。これらのモデルにおける時間間隔を無限に小さくしていくと、連続時間レプリケーターダイナミクスに収束します。
これらの概念を通じて、進化ゲーム理論は、合理的な
意思決定を前提としない集団における協調、競争、多様性の維持といった複雑な現象を理解するための強力なフレームワークを提供しています。