H.264/MPEG-4 AVC:高効率動画圧縮技術の深層
H.264/MPEG-4 AVCは、デジタル映像を効率的に圧縮するための国際標準規格です。ITU-Tが「H.264」、ISO/IECが「MPEG-4 Part 10 Advanced Video Coding」としてそれぞれ規定していますが、両者は技術的に同一です。MPEG-2に比べて2倍以上の圧縮効率を実現し、
携帯電話からHDTV放送まで幅広い用途で活用されています。その高い圧縮率は、高度な圧縮アルゴリズムによるものです。
高度な圧縮アルゴリズム
H.264/MPEG-4 AVCの圧縮アルゴリズムは、従来のMPEG-1、MPEG-2、H.261、H.263、MPEG-4などをベースに、数々の改良を加えたものです。空間変換、フレーム間予測、
量子化、エントロピー符号化といった基本的な技術に加え、算術符号化や高度なフィルタリング技術などを用いることで、圧倒的な圧縮効率を実現しています。
整数変換
従来の規格では、実数精度演算が必要な離散コサイン変換(DCT)を用いていました。H.264では、加減算とビットシフトのみで処理可能な整数変換を採用することで、計算の簡素化とデコーダ間での出力結果の統一を実現しました。これにより、エンコード時にイントラマクロブロックを挿入する必要がなくなり、圧縮効率が向上しました。ブロックサイズは当初4×4画素でしたが、高解像度
動画に対応するため、後に8×8画素も追加されました。
フレーム間予測
H.264では、複数の参照フレームを用いたフレーム間予測が可能です。シーンチェンジや動きの激しいシーンでも、適切な参照フレームを選択することで予測精度を向上させます。さらに、未来のフレームを参照するBフレームについても、複数の参照フレームから最適なものを選択できるようになりました。複数の参照フレームを効率的に管理するために、IDR(Instantaneous Decoder Refresh)フレームが導入されています。
可変ブロックサイズ
動き補償の単位となるブロックサイズを可変にすることで、シーンの動きや形状に最適なブロックサイズを選択できます。16×16, 16×8, 8×16, 8×8画素ブロックに加え、8×8ブロックをさらに分割するサブブロック機能も備えています。
重み付け予測
フェードやディゾルブといった特殊効果のある
動画において、参照フレームの予測誤差に重み付けを行うことで、画質劣化を抑制します。
1/4画素精度動き補償
動き補償の精度を1/4画素単位にすることで、滑らかな動き表現を実現します。特に、ゆっくりとしたパンニングシーンなどでその効果を発揮します。
イントラ予測
フレーム間予測を用いないイントラコーディングにおいて、隣接するマクロブロックの画素値から予測値を生成します。4×4および16×16画素ブロックの輝度成分と、8×8画素ブロックの色差成分に対して、複数の予測パターンを用いることで、より正確な予測を行い、符号化効率を高めています。
エントロピー符号化
可変長符号化(VLC)と算術符号化(CABAC)の2種類から選択可能です。CAVLC(Context-based Adaptive VLC)とUVLC(Universal VLC)はVLCの一種であり、CABACは算術符号化の一種です。処理速度と圧縮効率のバランスに応じて最適な方式を選択できます。
デブロッキングフィルタ
ブロックノイズを抑圧するデブロッキングフィルタが搭載されています。このフィルタはブロック境界のみを平滑化し、処理負荷を抑えつつ効果的なノイズ低減を実現します。
SI、SPフレーム
動画ストリームの切り替えをスムーズに行うためのSI、SPフレームが用意されています。特に、SPフレームは、切り替え前のフレームを参照することで、シームレスな再生を実現します。
NAL構造
H.264のビットストリームは、VCL(Video Coding Layer)とNAL(Network Abstraction Layer)の2層構造を持っています。この構造によって、さまざまなファイルフォーマットやネットワーク環境への対応が容易になります。
マルチビュー符号化(MVC)
複数の視点からの映像を効率的に圧縮するMVCが追加されました。ベースビューと非ベースビューを定義することで、ビュー間の冗長性を活用し、圧縮効率を向上させます。
プロファイルとレベル
H.264では、用途に合わせて機能が制限されたプロファイルと、処理能力やメモリ容量を示すレベルが定義されています。これらによって、機器の性能やビットストリームの互換性を保証します。主なプロファイルには、ベースラインプロファイル、メインプロファイル、ハイプロファイル、マルチビューハイプロファイルなどがあります。レベルは、解像度やフレームレートの上限を規定します。
利用例
H.264は、
[デジタル放送]、
Blu-ray Disc、多くの
動画共有サービス(
YouTubeなど)、ゲーム機(
Wiiなど)など、様々な分野で広く利用されています。
H.264には多くの
特許が含まれており、製品に実装するには
ライセンス料の支払いが求められます。MPEG-LAコンソーシアムが
ライセンス管理を行っています。ただし、インターネット上の無料
動画コンテンツは使用料が免除される場合があります。
競合方式
H.264の主要な競合方式として、Microsoftが開発したVC-1があります。両者は同等の画質性能を持ちますが、H.264は国際標準規格であるため、より多くの機器や
ソフトウェアでサポートされています。
ウェブブラウザでの対応
H.264は、多くのウェブブラウザでサポートされていますが、かつてはロイヤリティの問題から一部のブラウザでは対応していませんでした。現在は主要なブラウザで広くサポートされています。
まとめ
H.264/MPEG-4 AVCは、その高い圧縮効率と幅広いサポートから、長年にわたって
動画圧縮の
デファクトスタンダードとして君臨してきました。高度な圧縮技術と国際標準規格としての地位が、その成功の鍵となっています。しかし、近年はより高効率な
コーデックも登場しており、今後どのような展開を見せるのか注目されます。