TwinVQとは？意味をやさしく解説 - サードペディア百科事典

TwinVQ（Transform-domain Weighted Interleave Vector Quantization）は、NTTヒューマンインターフェース研究所（現在のサイバースペース研究所）によって開発された音声符号化技術です。この技術の最大の特徴は、PCM（Pulse Code Modulation）形式の音声データを、元の約1/18という非常に小さなサイズにまで圧縮できる点にあります。これにより、データ容量を大幅に削減し、効率的な音声データの取り扱いが可能となりました。

開発の背景には、当時のISDN回線（INSネット64）の通信速度が64kbpsであったという制約がありました。この限られた帯域幅の中で、高品質な音声配信を実現するための技術としてTwinVQは生まれました。MP3などの既存の音声圧縮技術と比較して、TwinVQは情報再配分だけでなく、音声情報をパターン化されたブロックに分割し、それを事前に用意された標準パターンと置き換えるという独自の圧縮手法を採用しています。この手法により、より効率的なデータ圧縮を実現しています。

特に、低ビットレート領域において、TwinVQは優れた性能を発揮します。MP3と比較して、より少ないビットレートで可聴帯域の周波数を記録することができ、64kbps以下の帯域ではMP3よりも高品質な音声を提供できます。NTTは、80kbpsのTwinVQが128kbpsのMP3に匹敵する音質を実現すると公表していました。ただし、低ビットレート領域での評価が高い一方で、それ以外のビットレート領域では、必ずしも高い評価を得ているわけではありません。これは、特定の帯域に最適化された圧縮アルゴリズムによる影響と考えられます。

TwinVQの技術は、一部が変更された上で、MPEG-4 General Audioの一部として採用されました。MPEG-4は、マルチメディアコンテンツの規格として広く利用されており、TwinVQの採用は、その技術の信頼性と有用性を示すものです。MPEG-4には、TwinVQの他にAAC（Advanced Audio Coding）などの音声符号化方式が含まれています。

TwinVQは、SolidAudioという音楽配信方式や、ヤマハのSoundVQ、VoxwareのMetasoundなどの技術にも採用されており、その応用範囲は多岐にわたります。FFmpegがDemuxやデコードに対応しているため、VLCメディアプレーヤーなど、多くのメディアプレーヤーでTwinVQ形式の音声ファイルを再生できます。これにより、TwinVQで圧縮された音声コンテンツの利用が容易になっています。

仕様

アルゴリズム：TwinVQ（変換領域重み付けインターリーブベクトル量子化）

サンプリングレート：8 kHz - 44.1 kHz

チャンネル数：1ch（モノラル）、2ch（ステレオ）

ビットレート：1chあたり 8 kbps - 96 kbps

MIMEタイプ：audio/x-twinvq, audio/x-twinvq-plugin

TwinVQ

仕様

関連項目