GSM-FR (GSM Full Rate) について
GSM-FR(
GSM Full Rate)、または
GSM 06.10 は、
GSM デジタル携帯電話システムで最初に採用された
音声符号化方式です。この
コーデックは13.0kbpsの
ビットレートで動作します(
VoIPなどでは13.2kbpsに丸められることがあります)。
GSM-EFRやAMRといった後続の
コーデックと比較すると
音質面で劣りますが、その分、符号化に必要な計算量が少ないという特徴があります。初期の
GSM携帯電話で広く利用され、現在でも
VoIPソフトウェアなどで使われています。
概要
GSM-FRは、
GSMシステムで最初に導入された
音声符号化方式で、その仕様は現在ETSI 06.10として定義されています。1985年に基本となる方式が発表された後、評価と改良を重ね、
GSMフェーズ1で標準
コーデックとして採用されました。
当時の他の方式と比較して、
音質が優れており、低
ビットレートが要求される
携帯電話用としては計算量が少ないため、
GSMの普及と共に世界中で広く利用されました。現在の
携帯電話ではCELPやその派生方式が主流ですが、
GSM-FRではRPE-LTPという比較的シンプルなアルゴリズムを使用しています。ただし、
音質は一般的な有線電話回線よりも劣ります。
入出力サンプリング周波数:8 kHz、13ビット
ビットレート:13.0 kbps (33バイト/20ms の場合 13.2 kbps)
アルゴリズム:RPE-LTP (Regular Pulse Excitation - Long Term Prediction)
フレーム長:20 ms
符号化遅延:20 ms
GSMで最初に利用された
音声符号化方式
必要な演算量が少ない (約4.5 MIPS)
このコーデックは古い規格のため、VoIPソフトウェアでも利用されています。例えば、Ekiga、QuteCom、Linphone、Asterisk (PBX) などでサポートされています。
RPE-LTP (Regular Pulse Excitation - Long Term Prediction) について
多くの低ビットレート音声符号化方式では、人間の声道に対応する線形予測フィルターの係数と、声帯音に対応する励起信号の情報で音声を表現します。励起信号は線形予測の残差から計算されます。
GSM-FRで使用されるRPE-LTPは、線形予測の残差を効率的に表現するために、長期予測と一定間隔で配置されたパルス信号を使用します。長期予測は、有声音のような周期性の高い信号を効率的に表現するために使用され、CELPの適応コードブックと同様の役割を果たします。線形予測の残差に残っている長期的な周期性を、信号周期から決定される遅延時間と振幅の変化を表すゲインでパラメータ化します。
残差信号のうち、長期予測で表現しきれなかった部分は、一定間隔に配置されたパルス信号の組み合わせで表現します。この方式では、パルスは一定間隔(例:3サンプルごと)で配置され、その振幅で情報を伝えます。
GSM-FRの符号化処理
GSM-FRの符号化処理は、20ms長(160サンプル)のフレームと5ms長(40サンプル)のサブフレームを単位として行われます。
1. 入力信号から線形予測フィルターの係数を計算(20msフレームごと)
2. フィルター係数をLAR(Log Area Ratio)に変換し量子化
3. 線形予測フィルターの残差信号から長期予測係数を計算(LTP)
4. 残差信号から長期予測分を引いた信号をパルス列で符号化(RPE)
5. 各サブフレームごとに長期予測の遅延時間とゲインを決定
6. 残差を最もよく表現できるパルス列を決定(3サンプルごと、13サンプル/サブフレーム)
7. パルス列の振幅を適応PCM(Adaptive PCM)で量子化
最後に、残差信号を最もよく表現できるパルス列を選択する際に、エネルギー総和が最大となるように開始位置が調整されます。
復号処理では、符号化の逆の手順で音声信号を復元します。
GSM-FRのビット構成は以下の通りで、これにより13.0 kbpsのビットレートを実現しています。
(詳細なビット構成は、原文を参照してください。)
実装
通常のGSM携帯電話以外にも、libgsmというGSM-FRコーデックのフリー実装があり、様々なプラットフォームで使用できます。libgsmはユッタ・デグナーとカーステン・ボルマンによって開発されました。
Microsoftによる独自実装としては、"MS GSM" (Microsoft GSM 6.10 Audio Codec) があります。これはETSI GSM 06.10と互換性がありますが、Microsoft独自のフレーム形式を使用しています。
また、Ekiga、QuteCom、Linphone、Asterisk (PBX) などのVoIPソフトウェアでもGSM-FRコーデックが利用されています。
歴史
RPE方式は1985年に発表され、1987年にフィリップスからGSMの音声符号化方式として提案されました。これは、任意の位置/振幅のパルス列と線形予測符号を組み合わせたMPLPC方式を単純化したものです。
当初、RPE方式はIBMなどの提案よりも音質が優れていましたが、ビットレートが高く通信エラー時に音質が劣化しやすいという課題がありました。IBMとの協力により、LTP(長期予測)を組み合わせたRPE-LTP方式が開発され、音質を維持したままビットレートを13kbpsに低減することに成功し、GSMフェーズ1で採用されました。
その後、GSM-HR、GSM-EFR、AMRなど、様々なコーデックが開発されました。
関連情報
参考文献
Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed). Springer Handbook of Speech Processing. Springer, 2007. ISBN 978-3540491255.
P. Vary, K. Hellwig, R. Hofmann, R.J. Sluyter, C. Galand, M. Rosso: Speech codec for the European mobile radio system, Proc. IEEE Int. Conf. Acoust. Speech Signal Process, pp.227–230, 1988.
関連項目
音声符号化
ETSI
AMR
AMR-WB
AMR-WB+
GSM-EFR
GSM-HR
GSM
外部リンク
RFC 3551 - GSM (GSM 06.10)の RTP ペイロード形式
ETS 300 961 (GSM 06.10) -
GSM 06.10の仕様書
*
ETS 300 580-2 (GSM 06.10) -
GSM 06.10の旧仕様書