MPEG-4 SLS

MPEG-4 SLS (Scalable Lossless Coding) とは



MPEG-4 SLSは、MPEG-4オーディオ規格の一部として定義された、オーディオ信号のスケーラブルなロスレス圧縮方式です。既存の非可逆圧縮方式であるMPEG-4 AACをベースとして、その符号化で失われた誤差信号を段階的に符号化することで、音質の劣化を最小限に抑えたニアロスレス信号から、元のオーディオ信号と全く同じロスレス信号まで、多様な音質レベルを1つの符号化結果から取り出すことができるのが特徴です。

この技術は、様々なコアコーデックにも応用可能で、そのコア技術を「Scalable to Lossless (SLS)」、特にAAC LCとの組み合わせを「HD-AAC」と呼ぶこともあります。

スケーラビリティがあるため、放送における保存、伝送、配信など、異なる品質レベルが求められる用途や、音質が重要な音楽スタジオでの編集作業、多様なビットレートでの音楽配信など、様々な場面で活用できます。


MPEG-4 SLSの概要



MPEG-4 SLSは、MPEG-4オーディオで定義されたロスレスオーディオ符号化ツールの一つであり、ISO/IEC 14496-3 Subpart 12で規格化されています。

この技術は、シンガポールのインフォコム研究所 (I2R) と、MP3を開発したドイツのフラウンホーファーIISが共同で開発しました。

通常、MPEG-4 SLSは、非可逆圧縮を行うコアコーデックAACが一般的)と、誤差成分をロスレス圧縮する拡張部分から構成されます。符号化されたビットストリームには、コアコーデックの符号化結果が含まれているため、MPEG-4 AACコーデックとの下位互換性を持ちます。コアコーデックを使わず、拡張部分のみで符号化を行う設定(SLSノンコア)も可能です。

MPEG-4 SLSの特徴:

ニアロスレスから完全なロスレスまで段階的に拡張可能。
スケーラブルなサンプリング周波数(192 kHzまで対応)。
MPEG-4 AACとの下位互換性(コアコーデック使用時)。
圧縮率は対象となる音楽やサンプリング周波数によって異なります。例として、平均的な圧縮率の数値が高いほど、圧縮効率が高いと言えます。


MPEG-4オーディオにおける位置づけ



MPEG-4オーディオは、多くのツールを組み合わせて構成されています。MPEG-4 SLSは、その中でロスレスオーディオ符号化ツールに分類されます。

同じカテゴリのツールには、スーパーオーディオCDで使われるMPEG-4 DSTや、PCM信号のロスレス圧縮専用のMPEG-4 ALSなどがあります。これらはそれぞれ異なる符号化方式を採用しています。


アルゴリズム



MPEG-4 SLSは、MPEG-4 AACの拡張として設計されており、コアとなるAACコーデックと拡張部分で構成されます。コアコーデックでは、MDCT(Modified Discrete Cosine Transform)を用いて入力信号を周波数領域に変換し、音響心理学モデルに基づいて聴覚上重要な部分を符号化します。

拡張部分では、同じ入力信号を整数MDCT (IntMDCT) で周波数領域に変換し、コアコーデックの情報を逆量子化した信号との差分を求めます。この差分が、本来の信号とコアコーデックで符号化できた信号の間の誤差を表します。この誤差情報は、エントロピー符号化を用いて圧縮されます。

拡張部分で符号化される誤差情報は、上位ビットから順に階層化され、コアコーデックの符号化結果に追加されます。階層が増えるにつれて、下位ビットの情報が追加され、データ欠落が少なくなり、すべての階層を取り出せばロスレス符号化結果が得られます。コアコーデックの符号化結果のみを取り出すことも可能です。

復号時には、コアコーデックと拡張部分の符号化結果を取り出し、符号化とは逆の処理を行うことで最終的な信号が復元されます。

具体的には、コアコーデックの情報からMPEG-4 AACの復号アルゴリズムを用いて周波数領域の係数を求め、それを逆量子化した信号と、誤差情報を表す拡張部分の復号結果を足し合わせることで、本来の周波数領域の信号を求めます。最後に、整数MDCTの逆変換を行い、時間領域の信号に戻します。

コアコーデックを使用しない設定では、整数MDCTとエントロピー符号化のみで、信号のすべての情報を階層的に符号化します。復号時には、エントロピー符号化の結果を復号し、整数MDCTの逆変換を行って入力信号を復元します。


整数MDCT (IntMDCT)


整数MDCTは、整数で近似された可逆性のあるMDCTです。通常のMDCTでは、計算時の丸め誤差により逆変換で元の値に戻らないのに対し、整数MDCTでは逆変換で元の値を完全に復元できます。そのため、周波数領域でのロスレス圧縮に適しています。

通常のMDCTを単純に整数に丸めながら処理すると、丸め誤差が蓄積して精度が低下します。整数MDCTでは、丸め回数を減らす工夫がされており、精度の低下を抑制しています。


エントロピー符号化


誤差情報は、周波数領域でのスペクトル成分の係数として表現されます。符号化結果を階層的に取り出せるよう、各係数は上位ビットから順に階層化され、各階層のビットプレーンごとにエントロピー符号化が行われます。

ビットプレーンの符号化には、以下のいずれかのアルゴリズムが用いられます。

ビットプレーンゴロム符号 (BPGC)
コンテキストベース算術符号 (CBAC)

また、ほとんど無音の周波数領域/時間領域は、低エネルギーモード符号化という別の方式で符号化されます。

ビットプレーンゴロム符号は、ゴロム符号の一種で、比較的シンプルでありながら効率的な圧縮が可能です。

コンテキストベース算術符号は、より高度な圧縮方法で、符号化対象のスペクトル成分の係数の周波数帯域などの状況(コンテキスト)に応じて、シンボルごとの確率分布を調整することで、最適なデータ圧縮を行います。

低エネルギーモード符号化は、無音に近い信号のエネルギーが低い領域で、整数MDCTの丸め誤差による雑音成分の影響が大きくなるため、通常の符号化方式では圧縮効率が低下するのを防ぎます。


ソフトウェア



MPEG-4 SLSのリファレンス実装は、ISO/IEC 14496-5:2001/Amd.10:2007で定義されています。

また、フラウンホーファーIISは、組み込みシステム向けや各種PC向けのソースコードライブラリを提供しています。


ライセンス



ドルビーラボラトリーズの子会社であるVia Licensing社が、MPEG-4 SLSの特許プールを管理しています。これには、シンガポールのASTAR ETPL、ドイツのフラウンホーファーIIS、およびNTTの特許が含まれます。

MPEG-4 SLSのライセンスは有料であり、PC向けのデコーダも含まれます。


歴史



2002年6月、Moving Picture Experts Group(MPEG)によるロスレスオーディオ符号化方式の提案要求に対し、ベルリン工科大学、NTT、リアルネットワークス、インフォコム研究所、フラウンホーファーIIS、マイクロソフトサムスン電子の7社からコーデックの提案がありました。

提案には、可逆圧縮のみを行う方式(後のMPEG-4 ALS)と、非可逆/可逆圧縮のハイブリッド方式(後のMPEG-4 SLS)が含まれていました。

MPEGは両方の方式をサポートすることを決定し、2003年6月にインフォコム研究所の提案をリファレンスモデルとして採用しました。この方式は当初、「Advanced Audio Zip (AAZ)」と呼ばれていました。

その後、フラウンホーファーIISとインフォコム研究所が共同で、圧縮性能、柔軟性、演算量を改善し、現在のMPEG-4 SLSの最終案をまとめました。最初の規格であるISO/IEC 14496-3:2005/Amd 3:2006 Scalable Lossless Coding (SLS) は2006年3月に出版されました。


参考文献



Andreas Spanias, Ted Painter, Venkatraman Atti (ed). Audio signal processing and coding. Wiley-Interscience, John Wiley & Sons, Inc., 2006. ISBN 978-0471791478.
ISO/IEC. Information technology — Coding of audio-visual objects — Part 3:Audio. ISO/IEC 14496-3:2009, Fourth edition, 2009.


関連項目



ロスレス圧縮
Apple Lossless
ATRAC Advanced Lossless (AAL)
Windows Media Audio Lossless
Monkey's Audio
FLAC
MPEG-4 DST
MPEG-4 ALS
MPEG-4


外部リンク



International Organisation for Standardisation MPEG-4 SLS page - Moving Picture Experts GroupMPEG-4 SLS解説
HD-AAC - Fraunhofer IISのHD-AAC解説
MPEG-4_SLS'>MPEG-4 SLS - MultimediaWiki
AStar press release - シンガポールASTARのプレスリリース
Fraunhofer - Fraunhofer IISウェブページ
The MPEG Home Page - 公式MPEGウェブページ

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。