Warped Linear Predictive Coding (WLPC) の解説
Warped Linear Predictive Coding (WLPC)、あるいはWarped Linear Prediction (WLP) は、人間の
聴覚特性を考慮した改良型の
線形予測符号化技術です。従来の
線形予測法では周波数軸が線形に扱われますが、WLPCでは人間の
聴覚特性に合わせた非線形な周波数軸、例えばバーク尺度やメル尺度を用いることで、より自然で効率的な音
声表現を実現します。
線形予測とWLPCの比較
通常の
線形予測符号化では、音
声信号を過去の信号の線形結合で予測します。この予測は一定の時間間隔で過去の音
声信号を参照しますが、WLPCでは周波数によって異なる時間遅延を用いる点が大きな違いです。これは、人間の
聴覚が周波数によって異なる分解能を持つことを反映しています。低い周波数では分解能が高く、高い周波数では分解能が低いという特性を、WLPCはオールパスフィルタによって実現しています。
オールパスフィルタとワープ係数
WLPCでは、単位遅延z⁻¹の代わりに、オールパスフィルタD(z)を用います。
D(z) = (z⁻¹ - λ) / (1 - λz⁻¹)
ここで、λはワープ係数と呼ばれ、-1 < λ < 1の範囲の値を取ります。λが0の場合、D(z)は単位遅延z⁻¹となり、通常の線形予測と同じになります。λが0から離れるほど、周波数特性の歪み(ワーピング)が大きくなり、人間の
聴覚特性への適合度が高まります。
このワープ係数は、周波数ごとに変化させることで、低い周波数では高い分解能、高い周波数では低い分解能といった、人間の
聴覚特性に合わせた処理を実現します。臨界帯域幅という概念もこの点に関連しており、周波数が高いほど臨界帯域幅が大きくなる人間の
聴覚の性質を反映しています。
WLPCの利点
WLPCの利点は、以下の通りです。
少ないパラメータで高精度な音声表現: 人間の
聴覚特性に合わせた非線形な周波数軸を使用することで、従来の
線形予測法よりも少ないパラメータで同等の、もしくはそれ以上の音
声品質を実現できます。
人間の聴覚に最適化: 人間の
聴覚特性に合わせた処理を行うため、より自然で聞きやすい音
声合成、音
声認識、音
声符号化が可能です。
広帯域音声符号化への適性: 広帯域音
声の符号化において、高い周波数領域の情報を効率的に表現できます。
WLPCの歴史
周波数ごとに遅延時間が異なるオールパスフィルタの概念自体は古くから存在し、1970年代には既に研究されていました。その後、1980年代にはStrubeによって、人間の
聴覚特性を考慮した線形予測への応用が試みられました。近年では、LaineらによるFAM(Frequency-Amplitude Modulated complex exponencials)やFAMletといった、より高度な周波数ワーピング手法も提案されています。
まとめ
WLPCは、人間の
聴覚特性を考慮した革新的な音
声符号化技術です。少ないパラメータで高品質な音
声表現を実現できることから、音
声認識、音
声符号化、音
声合成など、様々な音
声処理アプリケーションへの応用が期待されています。今後の研究開発により、さらに高度な音
声処理技術へと発展していくと考えられます。
参考文献
A. Härmä, et al. (2000) Frequency-warped signal processing for audio appllications. J. Audio Eng., vol.28, No.11, pp.1011-1031, Nov. 2000.
A. Härmä, U.K. Laine. (2001) A comparison of warped and conventional linear predictive coding. Speech and Audio Processing, IEEE Transactions on , vol. 9, no.5 pp.579-588, July 2001.
J. Pohjalainen. (2004) Frequency-Warped Linear Prediction and Speech Analysis. Master's Thesis, Helsinki University of Technology, 2004.
* H.W. Strube. (1980) Linear prediction on a warped frequency scale. Journal of the Acoustical Society of America, vol. 68, no. 4, pp.1071-1076, Oct 1980.