bzip2は、ジュリアン・スーアードによって開発された
データ圧縮プログラムとその圧縮データフォーマットです。BSDスタイルのライセンスで提供されており、1996年6月に最初に公開されて以来、安定性と人気を高めてきました。2000年末にはバージョン1.0がリリースされ、広く利用されるようになりました。
bzip2で圧縮されたファイルには、一般的に
拡張子「.bz2」が付与されます。このプログラム自体にはアーカイブ機能は含まれておらず、単独での圧縮・解凍機能のみを提供しています。
圧縮
アルゴリズムにおいては、bzip2はブロックソート法(バロウズ-ホイラー変換)、MTF(Move-To-Front)法、そして
ハフマン符号化法という高度な技術を組み合わせています。これにより、従来のgzipやZIPといった圧縮方式よりも高い圧縮率を実現しています。bzip2の操作方法は意図的にgzipに似せて設計されており、gzipからの移行を容易にしています。しかしながら、圧縮処理速度の面ではgzipに劣るため、完全にgzipを置き換えるには至っていません。さらに、高圧縮率を誇るフォーマットとしてはxzも登場しており、競争が激化しています。
しかし、bzip2はStuffItや7-Zipといった高圧縮プログラムと比較した場合、同程度の圧縮率を維持しつつも処理速度が速いという利点があります。そのため、特にネットワーク経由で配布される比較的大きなサイズのファイルの圧縮によく利用されています。代表的な例としては、
Linuxカーネルのソースコード群が挙げられます。
bzip2の前身となる「bzip」では、圧縮
アルゴリズムに
算術符号が使用されていました。しかし、
算術符号に関わる
特許の問題によって開発の継続が困難になったという経緯があります。このため、
特許問題を回避しつつ、より高い圧縮率を目指してbzip2が開発されました。
このようにbzip2は、その高い圧縮率と比較的速い処理速度から、多くの場面で利用される
データ圧縮ツールです。gzipに似た操作性も、利用が広まっている要因の一つです。
外部リンク
The bzip2 and libbzip2 home page