G.711は、国際電気通信連合電気通信標準化部門(ITU-T、旧CCITT)によって
1972年に策定された
音声符号化規格です。この規格は、主に固定電話網における音声信号のデジタル伝送に広く用いられています。
符号化方式
G.711では、非線形
パルス符号変調(PCM)方式を採用しています。これは、アナログの音声信号をデジタルデータに変換する際に、信号の振幅を均等な間隔で量子化するのではなく、信号レベルに応じて量子化幅を変化させる方式です。具体的には、音声信号の振幅が小さい部分では量子化幅を小さくし、大きい部分では量子化幅を大きくすることで、音量の小さい部分のノイズを低減しています。
標本化周波数
G.711規格では、音声信号をデジタル化する際の標本化周波数を8000Hz(8kHz)と定めています。これは、人間の可聴周波数帯域をカバーするために十分な周波数です。この周波数で標本化された音声データは、1秒間に8000個のサンプルを持つことになります。
圧伸特性
G.711では、信号レベルが小さい時の量子化雑音を低減するため、非線形量子化が行われます。この際に使用される圧伸特性には、主にμ-lawとA-lawの2種類が存在します。
μ-law
μ-lawは、主に北米や日本で使用されている圧伸特性です。14ビットの符号付き線形PCMの1標本を、対数的に8ビットに変換します。この変換により、データ量が削減されると同時に、小さい音量での歪みを抑えることができます。
A-law
A-lawは、主に欧州などで使用されている圧伸特性です。13ビットの符号付き線形PCMの1標本を、対数的に8ビットに変換します。A-lawは、
コンピュータ処理の容易性を特に考慮して設計されています。
どちらの方式も、音声レベルが0dBとなるサンプルを規格に含んでおり、音声データの整合性を確保しています。
A-law 符号化
A-lawの符号化器では、入力された音声サンプルが特定のルールに従って8ビットの値に変換されます。例えば、入力値1000000010101111は10001010に、0000000110101111は00011010に変換されます。この符号化後の値は、仮数部4ビットと指数部3ビットを持つ
浮動小数点数として解釈できます。
μ-law 符号化
μ-lawの符号化器は、14ビットの符号付き線形オーディオサンプルを2の補数表現で受け取り、負の値であれば符号ビット以降を反転させ、さらに33(2進数100001)を加算して8ビットの値に変換します。これにより、データ量の削減と音質の維持を両立させています。
特徴
標本化周波数: 8kHz
ビットレート: 64kbps (8kHz × 8ビット)
アルゴリズム遅延: 通常0.125ms (先読み遅延なし)
関連技術
コンパンディング: 音声信号を伝送する際、ダイナミックレンジを圧縮・伸張する技術。G.711の圧伸特性は、
コンパンディングの一種です。
音声符号化: 音声信号を効率的にデジタルデータに変換する技術の総称です。
外部リンク
ITU-T Recommendation G.711 - ITU-TによるG.711規格の原文
*
G.711 codec process - G.711
コーデックのプロセスに関する資料
G.711は、そのシンプルさと低遅延性から、現在でも多くの固定電話網で使用されている重要な
音声符号化規格です。