TwinVQ(Transform-domain Weighted Interleave Vector Quantization)は、NTTヒューマンインターフェース研究所(現在のサイバースペース研究所)によって開発された
音声符号化技術です。この技術の最大の特徴は、PCM(Pulse Code Modulation)形式の
音声データを、元の約1/18という非常に小さなサイズにまで圧縮できる点にあります。これにより、データ容量を大幅に削減し、効率的な
音声データの取り扱いが可能となりました。
開発の背景には、当時の
ISDN回線(INSネット64)の通信速度が64kbpsであったという制約がありました。この限られた帯域幅の中で、高品質な
音声配信を実現するための技術としてTwinVQは生まれました。
MP3などの既存の
音声圧縮技術と比較して、TwinVQは情報再配分だけでなく、
音声情報をパターン化されたブロックに分割し、それを事前に用意された標準パターンと置き換えるという独自の圧縮手法を採用しています。この手法により、より効率的な
データ圧縮を実現しています。
特に、低ビットレート領域において、TwinVQは優れた性能を発揮します。
MP3と比較して、より少ないビットレートで可聴帯域の周波数を記録することができ、64kbps以下の帯域では
MP3よりも高品質な
音声を提供できます。NTTは、80kbpsのTwinVQが128kbpsの
MP3に匹敵する音質を実現すると公表していました。ただし、低ビットレート領域での評価が高い一方で、それ以外のビットレート領域では、必ずしも高い評価を得ているわけではありません。これは、特定の帯域に最適化された圧縮アルゴリズムによる影響と考えられます。
TwinVQの技術は、一部が変更された上で、
MPEG-4 General Audioの一部として採用されました。
MPEG-4は、マルチメディアコンテンツの規格として広く利用されており、TwinVQの採用は、その技術の信頼性と有用性を示すものです。
MPEG-4には、TwinVQの他に
AAC(Advanced Audio Coding)などの
音声符号化方式が含まれています。
TwinVQは、SolidAudioという音楽配信方式や、ヤマハのSoundVQ、VoxwareのMetasoundなどの技術にも採用されており、その応用範囲は多岐にわたります。
FFmpegがDemuxやデコードに対応しているため、VLCメディアプレーヤーなど、多くのメディアプレーヤーでTwinVQ形式の
音声ファイルを再生できます。これにより、TwinVQで圧縮された
音声コンテンツの利用が容易になっています。
仕様
アルゴリズム:TwinVQ(変換領域重み付けインターリーブベクトル量子化)
サンプリングレート:8 kHz - 44.1 kHz
チャンネル数:1ch(モノラル)、2ch(
ステレオ)
ビットレート:1chあたり 8 kbps - 96 kbps
MIMEタイプ:audio/x-twinvq, audio/x-twinvq-plugin
関連項目
データ圧縮
ベクトル量子化
*
AAC