RCELP

RCELP(Relaxed Code Excited Linear Prediction)とは



RCELP(Relaxed Code Excited Linear Prediction)は、音声符号化アルゴリズムであるCELPを改良し、圧縮率を向上させた技術です。この方式は、音声信号の波形をそのまま符号化するのではなく、信号をわずかに修正することで、より効率的な圧縮を実現します。主に携帯電話の音声コーデック、例えばEVRC、SMV、VMR-WBなどで採用されています。

RCELPの概要



RCELPは、ベル研究所のクレイジン(W.B. Kleijn)らが開発しました。ベースとなるCELPは、人間の音声を声道に相当する線形予測フィルターと、声帯に相当する適応型および固定型コードブックを用いてモデル化します。分析合成法(analysis-by-synthesis)により、音声波形を再合成し、元の信号との誤差が最小になるようにコードブックを探索します。

CELPでは元の信号を直接比較しますが、RCELPではこの制約を緩め、時間軸方向に波形を修正した信号を比較します。人間の音声は、特定の周波数(ピッチ周波数)でほぼ同じ波形が繰り返され、その周波数は周期的に変動します。この波形を忠実に再現しようとすると、短い周期での分析と符号化が必要となり情報量が増加します。一方で、周期を長くすると情報量は削減できますが、ピッチ周波数の誤差により音質が低下してしまいます。

多くの符号化方式では、信号を短いサブフレームに分割してピッチ周波数の分析と符号化を行いますが、RCELPではピッチ周波数の細かい変動を無視し、大まかな周期で分析と符号化を行います。その間は補間によってピッチ周波数の軌跡を求め、実際のピッチ周波数との誤差分だけ元の信号を時間軸方向に伸長・圧縮します。この処理により、分析合成法を用いた場合の音質低下を防ぎます。

聴感上、ピッチ周波数の細かい変動を無視しても音質はほとんど変わらないとされており、信号修正による演算量の増加はありますが、音質を維持したまま情報量を削減できます。

RCELPの詳細



RCELPは、「Generalized Analysis-by-Synthesis」(合成による分析の一般化)という手法の応用例として最初に発表され、後にRCELPと命名されました。この一般化された分析合成法では、入力信号にも何らかの変更を加えて誤差を最小化します。この変更は、聴感上同じに聞こえるように行われます。RCELPは、この手法をピッチ周波数の時間軸方向の修正に応用したものです。

RCELPの構成は、通常のCELPに以下の機能を追加したものとなります。

1. 入力信号のピッチ周波数推定:オープンループでピッチ周波数を推定します。
2. ピッチ周波数の軌跡計算:ピッチ周波数を補間してフレーム内の軌跡を計算します。このピッチ周波数はCELPでの適応型コードブックの更新にも使用されます。
3. ピッチ周波数の軌跡に合わせた入力信号の修正:入力信号を補間やシフトにより時間軸方向に伸長・圧縮します。

実際に使用される場合、時間軸方向に伸長・圧縮される信号は入力信号だけに限らず、例えば、携帯電話用のコーデックであるEVRCやVMR-WBでは、入力信号を直接修正するのではなく、線形予測フィルターを通した後の残差信号を修正します。

RCELPの応用



RCELPは、特に携帯電話の音声通信において重要な役割を果たしています。圧縮率を高めることで、限られた帯域幅で高品質な音声通信を可能にし、バッテリー消費を抑えることにも貢献しています。また、VoIPなどの音声通信分野でも広く利用され、効率的な音声符号化技術として重要な位置を占めています。

まとめ



RCELPは、CELPをベースに、時間軸上の信号修正を取り入れることで、より効率的な音声符号化を実現する技術です。ピッチ周波数の変動を考慮しつつ、音質を維持したままデータ量を削減できるため、携帯電話をはじめとする様々な音声通信分野で幅広く活用されています。

脚注



参考文献
Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
W.B. Kleijn, R.P. Ramachandran, P. Kroon: Generalized analysis-by-synthesis coding and its application to pitch prediction, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.337-340(vol.1), 1992.
W.B. Kleijn, P. Kroon, L. Cellario, D. Sereno: A 5.85 kb/s CELP algorithm for cellular applications, Proc. IEEE Int. Conf. Acoust. Speech Signal Process. pp.596-599(vol.2), 1993.
W.B. Kleijn, D. Nahumi: RCELP coder, US Patent No.5704003, Dec. 30, 1997. (Filing Date Sep. 19, 1995.)
3GPP2. C.S0014-0 Version 1.0 Enhanced Variable Rate Codec (EVRC). 3GPP2, December, 1999.
3GPP2. C.S0030-0 Version 3.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems. 3GPP2, Jan, 2004.
3GPP2. C.S0052-A Version 1.0 Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Options 62 and 63 for Spread Spectrum Systems. 3GPP2, April, 2005.

関連項目
音声符号化
コーデック
CELP
EVRC
SMV
* VMR-WB

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。