リアプノフ方程式

制御理論における離散的リアプノフ方程式(りさんてきリアプノフほうていしき、: discrete Lyapunov equation)は次の形の方程式である。

A X A H X + Q = 0 {\displaystyle AXA^{H}-X+Q=0}

ここで Q {\displaystyle Q} エルミート行列 A H {\displaystyle A^{H}} A {\displaystyle A} 随伴行列

連続的リアプノフ方程式(continuous Lyapunov equation)は次の形の方程式である: A X + X A H + Q = 0 {\displaystyle AX+XA^{H}+Q=0}

リアプノフ方程式は、安定性解析最適制御といった、制御理論の多くの分野で現れる。本方程式や関連する方程式の名称はロシアの数学者アレクサンドル・リャプノフにちなんでいる。

安定性に対する応用

以下の定理では A , P , Q R n × n {\displaystyle A,P,Q\in \mathbb {R} ^{n\times n}} とし、また P {\displaystyle P} Q {\displaystyle Q} 対称行列とする。記法 P > 0 {\displaystyle P>0} は行列 P {\displaystyle P} 正定値であることを表す。

定理 (連続時間版): どのような Q > 0 {\displaystyle Q>0} に対しても、 A T P + P A + Q = 0 {\displaystyle A^{T}P+PA+Q=0} を満たす P > 0 {\displaystyle P>0} が一意的に存在するための必要十分条件は、線形常微分方程式系 x ˙ = A x {\displaystyle {\dot {x}}=Ax} が大域的に漸近安定(globally asymptotically stable)であることである。2次関数 V ( x ) = x T P x {\displaystyle V(x)=x^{T}Px} は安定性の保証に用いることができるリアプノフ関数である。

定理 (離散時間版): どのような Q > 0 {\displaystyle Q>0} に対しても、 A T P A P + Q = 0 {\displaystyle A^{T}PA-P+Q=0} を満たす P > 0 {\displaystyle P>0} が一意的に存在するための必要十分条件は、写像の反復による系 x ( k + 1 ) = A x ( k ) {\displaystyle x(k+1)=Ax(k)} が大域的に漸近安定であることである。上述と同様に、 z T P z {\displaystyle z^{T}Pz} がリアプノフ関数となる。

計算理論的側面

リアプノフ方程式を解くために特化した計算手法を用いることができる。離散型に対しては北川源四郎によるシューア法が頻用される[1]。連続型に対してはBartels–Stewart法が利用できる[2]

解析解

vec作用素 vec ( A ) {\displaystyle \operatorname {vec} (A)} を(行列 A {\displaystyle A} から1列のベクトルへの)積み重ね作用素とし、 A B {\displaystyle A\otimes B} A {\displaystyle A} B {\displaystyle B} クロネッカー積と定義すると、連続・離散時間のリアプノフ方程式を、ある行列方程式として表現できる。さらに、もし A {\displaystyle A} が安定的であれば、解もまたある積分(連続時間の場合)または級数(離散時間の場合)で表現できる。

離散時間

vec ( A B C ) = ( C T A ) vec ( B ) {\displaystyle \operatorname {vec} (ABC)=(C^{T}\otimes A)\operatorname {vec} (B)} という結果を使うと、次の方程式

( I n 2 A ¯ A ) vec ( X ) = vec ( Q ) {\displaystyle (I_{n^{2}}-{\bar {A}}\otimes A)\operatorname {vec} (X)=\operatorname {vec} (Q)}

が得られる。ここで恒等行列 I n 2 {\displaystyle I_{n^{2}}} 整合行列(英語版)である[3]。逆行列によってこの線形方程式を解けば vec ( X ) {\displaystyle \operatorname {vec} (X)} が求められる。行列 X {\displaystyle X} を得るには vec ( X ) {\displaystyle \operatorname {vec} (X)} を適切に配列し直せばよい。

さらに、 A {\displaystyle A} が安定的であれば、解 X {\displaystyle X} は次のように書ける。

X = k = 0 A k Q ( A H ) k {\displaystyle X=\sum _{k=0}^{\infty }A^{k}Q(A^{H})^{k}}

比較のために1次元の場合を考えてみると、これは単に ( 1 a 2 ) x = q {\displaystyle (1-a^{2})\,x=q} の解が x = q 1 a 2 = k = 0 q a 2 k {\displaystyle x={\tfrac {q}{1-a^{2}}}=\sum _{k=0}^{\infty }q\,a^{2k}} であると言っているのと同じことである。

連続時間

再びクロネッカー積とvec作用素の記法を用いると、行列方程式

( I n A + A ¯ I n ) vec X = vec Q {\displaystyle (I_{n}\otimes A+{\bar {A}}\otimes I_{n})\operatorname {vec} X=-\operatorname {vec} Q}

が得られる。ただし A ¯ {\displaystyle {\bar {A}}} は行列 A {\displaystyle A} の各要素を複素共役で置き換えた行列である。

離散時間の場合と同様に、 A {\displaystyle A} が安定的であれば、解 X {\displaystyle X}

X = 0 e A τ Q e A H τ d τ {\displaystyle X=\int _{0}^{\infty }\mathrm {e} ^{A\,\tau }Q\mathrm {e} ^{A^{H}\,\tau }d\tau }

と書ける。

比較のために1次元の場合を考えてみると、これは単に 2 a x = q {\displaystyle 2\,a\,x=-q} の解が x = q 2 a = 0 q e 2 a τ d τ {\displaystyle x={\tfrac {-q}{2\,a}}=\int _{0}^{\infty }q\,\mathrm {e} ^{2\,a\,\tau }d\tau } であると言っているのと同じことである。

関連項目

脚注

  1. ^ Kitagawa, G. (1977). “An Algorithm for Solving the Matrix Equation X = F X F' + S”. International Journal of Control 25 (5): 745–753. doi:10.1080/00207177708922266. 
  2. ^ Bartels, R. H.; Stewart, G. W. (1972). “Algorithm 432: Solution of the matrix equation AX + XB = C”. Comm. ACM 15 (9): 820–826. doi:10.1145/361573.361582. 
  3. ^ Hamilton, J. (1994). Time Series Analysis. Princeton University Press. Equations 10.2.13 and 10.2.18. ISBN 0-691-04289-6 
典拠管理データベース: 国立図書館 ウィキデータを編集
  • ドイツ