JBIG2は、Joint Bi-level Image Experts Group (
JBIG)によって開発された、
二値画像(白黒画像)のための
画像圧縮標準規格です。ITU-T勧告T.88およびISO/IEC 14492として国際標準化されており、
可逆圧縮と
非可逆圧縮の両方に対応しています。
JBIG2の最大の特徴は、従来のG4
ファクシミリや
JBIGに比べて格段に高い圧縮率を実現する点です。
可逆圧縮モードでは、G4
ファクシミリの3~5倍、
JBIGの2~4倍の圧縮率が期待できます。この高い圧縮率は、テキスト、ハーフトーン画像、その他データ領域をそれぞれ最適なアルゴリズムで圧縮することで実現されています。
圧縮アルゴリズム
JBIG2エンコーダは、入力画像をテキスト領域、ハーフトーン画像領域、その他データ領域に分割し、領域ごとに異なる圧縮アルゴリズムを適用します。
テキスト領域: テキスト領域では、同じ文字の複数出現を1つの代表的なパターンとして扱うことで圧縮を行います。この代表パターンは「シンボル」として辞書に登録され、文書中の文字は、辞書内のシンボルへの参照によって符号化されます。パターンマッチングと置換(PM&S)法、ソフトパターンマッチング(SPM)法という2つの方法が用いられ、SPM法では、文字の微妙な違いも考慮することで、より高精度な圧縮を実現します。
ハーフトーン画像領域: ハーフトーン画像領域では、2つの方法が用意されています。1つは、コンテキスト依存
算術符号アルゴリズムを利用した方法、もう1つは、グレースケール画像への変換と、固定サイズのビットマップパターンの辞書を用いた方法です。
*
その他データ領域: テキスト領域およびハーフトーン画像領域以外の領域は、MQコーダと呼ばれるコンテキスト依存
算術符号アルゴリズムによって圧縮されます。
すべての領域において、
算術符号化が用いられることで、効率的なエントロピー符号化が実現されています。
PDFファイルのバージョン1.4以降では、
JBIG2圧縮データを含めることが可能です。そのため、多くのPDF文書で
JBIG2が利用され、ファイルサイズの削減に貢献しています。
オープンソース実装
JBIG2のデコーダ、エンコーダともにオープンソース実装が存在しており、jbig2dec、jbig2-imageio、xpdfなどが知られています。これにより、
JBIG2の利用は容易になっています。
特許
JBIG2は、IBMと三菱電機が特許を保有していますが、無償ライセンスで利用可能です。ただし、
JBIGと
JBIG2の特許は別物であることに注意が必要です。
JBIG2は高い圧縮率を実現しますが、非可復号モードでは、
圧縮アーティファクトによってテキストが変更されてしまう可能性があります。特に、類似したシンボル(例えば「6」と「8」)の置換エラーが発生することが報告されており、スキャンされた文書の数字が変更されるといった深刻な問題も発生しています。
ゼロックスの複合機におけるこの問題の発生は、広く知られた事例です。このため、重要な文書のアーカイブなどには、
JBIG2の利用を避けるべきです。いくつかの国では、アーカイブ文書への
JBIG2の利用が禁止されています。
まとめ
JBIG2は、高い圧縮率と優れた圧縮性能を誇る
二値画像圧縮技術です。しかし、非可逆モードにおける置換エラーの問題には十分に注意する必要があります。利用用途に応じて、可逆モードの使用や、代替圧縮技術の検討が重要です。