最適制御

最適制御理論：動的システムの最適化

最適制御理論は、動的システムの挙動を、特定の評価関数を最適化（最小化または最大化）するように制御する手法です。これは、システムの状態方程式を制約条件とした最適化問題として定式化されます。状態や制御入力に関する様々な制約条件も考慮できる柔軟な枠組みです。変分法を基礎とするこの理論は、制御工学だけでなく、数理最適化や数理物理学とも密接に関連しています。

歴史

最適制御理論の中核となる最大原理と動的計画法は、1950年代半ばに独立して開発されました。しかし、その根底にある考え方は古くから存在し、変分法の発展と深く繋がっています。

最大原理は、ワイエルシュトラスの強い極値条件の一般化と捉えることができ、ポントリャーギンらによる研究で現代的な形式が確立されました。初期の研究では、「針状の変分」という手法が用いられ、最適性の必要条件であることが示されました。その後、非平滑解析の導入により、制御入力のクラスを拡大するなど、様々な拡張が行われています。

動的計画法はベルマンによって提唱されました。これは、最適制御問題をハミルトン-ヤコビ-ベルマン方程式という偏微分方程式に帰着させるアプローチです。この方程式の解は価値関数と呼ばれ、各状態における最適な制御入力の決定に役立ちます。

一般的な定式化

最適制御問題は、次のように定式化されます。

決定変数: システムの状態ベクトルx(t)と制御入力ベクトルu(t) (tは時間)。

目的関数: 評価関数Jを最小化（または最大化）する。Jは終端コストEとステージコストFの和で表現されることが多い。

制約条件: システムの状態方程式（システムの動特性を表す微分方程式）、終端条件、状態と制御入力に対する制約条件などが含まれる。

この一般的な定式化は、Bolza問題と呼ばれ、Eがゼロの場合をLagrange問題、Fがゼロの場合をMayer問題といいます。

一般的な解法

最適制御問題を解くための主なアプローチは、最大原理と動的計画法です。

動的計画法

動的計画法では、ハミルトン-ヤコビ-ベルマン(HJB)方程式を解くことで、価値関数を導出します。HJB方程式は偏微分方程式であり、解析解が得られるとは限りません。数値解法を用いる場合、状態変数の次元が増加すると計算コストが急激に増加する（次元の呪い）という問題があります。しかしながら、決定論的、確率論的なシステムのどちらにも適用できる汎用性があります。

最大原理

最大原理は、最適性の必要条件を与える手法です。このアプローチでは、常微分方程式と不等式からなる二点境界値問題を解く必要があります。動的計画法に比べ、計算コストは低い傾向にありますが、確率システムには適用できない場合が多いです。得られる解は、時間tの関数である開ループ制御となります。

LQ制御問題

解析的に解が得られる特殊なケースとして、線形二次制御問題(LQ制御)があります。これは、線形なシステムと二次形式の目的関数を扱う問題です。最適な制御入力は、リッカチ微分方程式（有限時間区間）またはリッカチ代数方程式（無限時間区間）を解くことで求めることができます。LQ制御で設計された制御器は、線形二次レギュレータ(LQR)と呼ばれます。

数値解法

一般的な最適制御問題は、解析解が得られないため、数値解法が不可欠です。主なアプローチとして間接法と直接法があります。

間接法

間接法では、最大原理から得られる一次の最適性条件（境界値問題）を数値的に解きます。この方法は、得られた解が最適性の必要条件を満たすことが保証されるという利点がありますが、複雑な問題では境界値問題を解くのが困難になる場合があります。

直接法

直接法では、制御入力や状態変数の軌道を近似し、非線形計画問題に変換して解きます。近年、特に直接選点法が人気があり、大規模な問題にも適用可能です。直接選点法では、スパース性の高い大規模な非線形計画問題を解くための効率的なソルバーが利用できるため、計算コストを抑えられます。様々なソフトウェアが開発されており、MATLABなどを通して利用できます。

まとめ

最適制御理論は、動的システムを最適に制御するための強力な枠組みです。最大原理、動的計画法、そして様々な数値解法が開発され、幅広い応用分野で活用されています。近年は、直接法を用いた数値解法が主流となり、より複雑な最適制御問題への対応が可能になっています。

もう一度検索