G.722 音声コーデックの詳細
G.722は、国際電気通信連合(ITU-T)によって標準化された広帯域音声
コーデックです。この
コーデックは、48kbps、56kbps、64kbpsの3つのビットレートに対応しており、従来の電話回線で使用されていた狭帯域
コーデックと比較して、より高品質な音声通信を可能にします。G.722は、その技術的な基盤として帯域分割ADPCM(Adaptive Differential Pulse Code Modulation)を採用しており、効率的な音声データの圧縮と復元を実現しています。
G.722の派生規格
G.722には、いくつかの派生規格が存在します。特に重要なのは、以下の2つです。
G.722.1: G.722.1は、G.722よりも低いビットレートでの圧縮を提供します。これにより、帯域幅が限られた環境でも音声通信が可能になります。
G.722.2: G.722.2は、AMR-WB(Adaptive Multiple Wideband)とも呼ばれ、さらに低いビットレートでの圧縮を実現します。また、G.722.2は、ネットワークの状況に応じて圧縮率を動的に変更する機能を持っており、ネットワークの
輻輳時でも安定した音声通信を維持できます。具体的には、ネットワークが混雑しているときは帯域幅を節約するために圧縮率を上げ、通常の状態に戻ると圧縮率を下げて音質を向上させます。
サンプリング周波数
G.722とその派生規格では、サンプリング周波数が16kHzに設定されています。これは、従来の電話回線で使用されていた8kHzの2倍であり、音声の再現性が大幅に向上しています。この高サンプリング周波数により、より自然でクリアな音声伝送が可能になり、特に高品質な音声通信が求められる場面でその効果を発揮します。
G.722の利用シーン
G.722は、主に
VoIP(Voice over Internet Protocol)などの音声通信システムで利用されます。7kHzの広帯域音声に対応しており、48kbps、56kbps、64kbpsのデータレートで音声ストリームを生成できます。
G.711などの狭帯域
コーデックと比較して、より高品質な音声を提供できますが、実装の複雑さは同程度であり、ネットワークの帯域幅に余裕がある環境であれば非常に有効です。帯域幅が限られた環境では、より低いビットレートで動作するG.722.1やG.722.2の方が適しています。
RTPによるカプセル化
G.722は、
VoIP環境では通常RTP(
Real-time Transport Protocol)を使用して転送されます。RTPペイロードタイプ9が一般的に用いられます。IANA(
Internet Assigned Numbers Authority)は、G.722のクロックレートを8kHzと定義していますが、これは歴史的な互換性を維持するための措置です。実際には、16kHzでエンコード/デコードが行われます。RFC3551では、この不一致について詳細に説明されています。
ビットレートの仕組み
G.722のビットレートは、64kbps、56kbps、48kbpsの3種類がありますが、データは常に64kbpsでエンコードされます。下位のサブバンドから補助データのエンコードにビットが使用され、補助データに割り当てられるビットが多いほど、実際の音声データのビットレートは低くなります。これにより、柔軟な帯域幅の調整が可能になっています。
ライセンスについて
G.722の特許は既に失効しており、誰でも自由に使用できます。これにより、様々なアプリケーションやシステムでG.722を実装することが容易になっています。
関連技術
G.722に関連する技術として、以下のものがあります。
音声符号化: 音声データを効率的に圧縮・符号化する技術全般。
G.711: 従来の電話回線で使用されていた狭帯域
コーデック。
G.722.1: G.722の低ビットレート派生規格。
G.722.2: AMR-WBとも呼ばれるG.722の低ビットレート派生規格。
G.723: 低ビットレートの音声コーデック。
G.723.1: G.723の改良版。
G.726: ITU-Tによって標準化された音声コーデック。
参考資料
G722 specification (PDF):
G722 specification (PDF)
この情報が、G.722
コーデックの理解に役立つことを願っています。