線形予測法(Linear Prediction)は、過去のデータ系列から未来の値を予測する
数学的な手法です。特に、
デジタル信号処理の分野では、
線形予測符号(LPC)として知られ、デジタルフィルタの一種として扱われます。また、システム分析の分野では、
数学的モデルや最適化手法として活用されています。
モデル
線形予測法では、ある
離散信号の系列 \( x(n) \) に対して、過去の \( p \) 個の標本を用いて、現在の値 \( \hat{x}(n) \) を予測します。この予測値は、予測係数 \( a_i \) を用いて次のように表されます。
\[
\hat{x}(n) = -(a_1 x(n-1) + a_2 x(n-2) + ... + a_p x(n-p)) = -\sum_{i=1}^{p} a_i x(n-i)
\]
これは、過去の \( p \) 個のデータを用いた
線形回帰モデルと見なすことができます。予測誤差 \( e(n) \) は、実際の値 \( x(n) \) と予測値 \( \hat{x}(n) \) の差として定義されます。
\[
e(n) = ||x(n) - \hat{x}(n)||
\]
パラメータ推定
予測係数 \( a_i \) の推定には様々な方法がありますが、最も一般的なのは二乗平均平方根基準(
自己相関基準)を用いる方法です。この方法は、二乗誤差 \( E[e^2(n)] \) の
期待値を最小化する係数を求めます。具体的には、以下の正規方程式(またはYule-Walker方程式)を解きます。
\[
\sum_{i=1}^{p} a_i R(i-j) = -R(j)
\]
ここで、\( 1 \le j \le p \) であり、\( R(i) = E\{x(n)x(n-i)\} \) は信号 \( x_n \) の
自己相関関数を表します。この方程式を行列形式で表すと次のようになります。
\[
Ra = -r
\]
ここで、\( R \) は
自己相関行列、\( r \) は
自己相関ベクトル、\( a \) は係数ベクトルです。この
自己相関行列はテプリッツ行列であり、対称性を持つため、効率的な解法が利用できます。また、より汎用的な形式として、以下の誤差関数を最小化する方式もあります。
\[
e(n) = x(n) - \hat{x}(n) = x(n) + \sum_{i=1}^{p} a_i x(n-i) = \sum_{i=0}^{p} a_i x(n-i)
\]
この場合、通常 \( a_0 = 1 \) と設定して、自明な解を避けます。
二乗予測誤差
予測誤差の二乗和を最小化する方法もよく用いられます。予測誤差 \( e_n \) は、\( a_0 = 1 \) を用いて以下のように表されます。
\[
e_n = 1x_n - \hat{x_n} = a_0 x_n + \boldsymbol{x_{n-1:n-P}}^T \boldsymbol{a_{1:P}} = \boldsymbol{x_{n:n-P}}^T \boldsymbol{a_{0:P}}
\]
全時点での予測誤差の二乗和 \( e = \sum_{n}^{N} e_n^2 \) を最小化することで、予測係数を推定します。この時、\( a_q \) に関する偏微分が 0 となる条件から、以下の関係式が得られます。
\[
\sum_{p=0}^{P} a_p \sum_{n}^{N} x_{n-q} x_{n-p} = 0
\]
ここで、\( \sum_{n}^{N} x_{n-q} x_{n-p} \) はラグ \( |p-q| \) の
自己相関関数 \( r_{|p-q|} \) とみなせるため、これを整理するとユールウォーカー方程式に帰着します。この方程式を解くことで予測係数を求めることができます。実際の計算では、高速な解法であるレビンソン再帰が用いられることが多いです。
スペクトル変換
信号の符号化では元信号から予測係数を計算しますが、信号生成タスクでは元信号が利用できません。そのため、スペクトルを
自己相関関数に変換して予測係数を推定する方法があります。これは、
ウィーナー=ヒンチンの定理を利用し、パワー
スペクトル密度のフーリエ逆変換が
自己相関関数となることを利用しています。具体的には、メル
スペクトログラムやMFCCをパワー
スペクトル密度に変換し、フーリエ逆変換を適用して得られた
自己相関関数から、テプリッツ行列を構成してユールウォーカー方程式を解くことで予測係数を求めます。
係数表現
線形予測における係数は、様々な形式で表現できます。代表的な表現としては、以下のものがあります。
線形予測係数(LP係数)
線スペクトル周波数(LSF)
反射係数(RC)
自己相関(AC)
ログ面積比(LAR)
反射係数のアークサイン(ASRC)
* LP合成フィルタのインパルス応答(IR)
これらの係数表現は、ノイズ耐性や計算量などの特性が異なります。例えば、
音声符号化では、アナログ回線に由来するノイズへの耐性を高めるために、LP係数以外の係数表現が用いられることがあります。
まとめ
線形予測法は、過去のデータから未来の値を予測する強力なツールであり、音声や画像処理をはじめとする様々な分野で応用されています。その柔軟性と効率性から、今後もその重要性は増していくと考えられます。