Namazu(なまず)は、オープンソースで開発されている
全文検索システムです。
UNIX系のOSだけでなく、Windows環境でも動作します。
歴史
Namazuは1997年に高林哲氏によって開発されました。当初は、比較的小規模なメールアーカイブやウェブサーバを対象とした
全文検索システムとして設計されました。その手軽な使いやすさから、1990年代末には日本語圏において代表的な検索エンジンとして広く普及しました。
2000年にはバージョン2.0が公開され、その後はNamazu Projectという名義で共同開発が進められています。
インデクシング
Namazuは、転置索引方式によるインデックスを採用しています。インデックスは、
Perlで記述された`mknmz`コマンドによって生成されます。テキストの
形態素解析には、KAKASI、ChaSen、MeCabといったツールが利用され、テキストを単語に分割します。
また、Namazuはフィルタ機能を備えています。この機能により、HTMLファイルだけでなく、Microsoft Office文書、PDFファイル、TeXファイルなど、様々な形式の文書を検索対象に含めることが可能です。
検索クライアント
作成されたインデックスを用いて、
C言語で記述された`namazu`コマンドが
全文検索を実行します。`namazu`コマンドはインデックスを動的に読み込み、検索結果を返します。
検索を行うための
フロントエンドも複数存在します。代表的なものとしては、
C言語で記述されたCGI
フロントエンドの`namazu.cgi`、
Perlで記述された`pnamazu`があります。また、Windows環境向けには`search-s for Namazu`、
Tcl/Tkを利用した`tkNamazu`、
Emacs上で動作する`namazu.el`など、様々な環境に適した検索クライアントが提供されています。
参考文献
馬場 肇『改訂Namazuシステムの構築と活用』ソフトバンクパブリッシング、2003年、ISBN 4-7973-2338-8
外部リンク
Namazu