Namazu

Namazu(なまず)は、オープンソースで開発されている全文検索システムです。UNIX系のOSだけでなく、Windows環境でも動作します。

歴史


Namazuは1997年に高林哲氏によって開発されました。当初は、比較的小規模なメールアーカイブやウェブサーバを対象とした全文検索システムとして設計されました。その手軽な使いやすさから、1990年代末には日本語圏において代表的な検索エンジンとして広く普及しました。2000年にはバージョン2.0が公開され、その後はNamazu Projectという名義で共同開発が進められています。

インデクシング


Namazuは、転置索引方式によるインデックスを採用しています。インデックスは、Perlで記述された`mknmz`コマンドによって生成されます。テキストの形態素解析には、KAKASI、ChaSen、MeCabといったツールが利用され、テキストを単語に分割します。

また、Namazuはフィルタ機能を備えています。この機能により、HTMLファイルだけでなく、Microsoft Office文書、PDFファイル、TeXファイルなど、様々な形式の文書を検索対象に含めることが可能です。

検索クライアント


作成されたインデックスを用いて、C言語で記述された`namazu`コマンドが全文検索を実行します。`namazu`コマンドはインデックスを動的に読み込み、検索結果を返します。

検索を行うためのフロントエンドも複数存在します。代表的なものとしては、C言語で記述されたCGIフロントエンドの`namazu.cgi`、Perlで記述された`pnamazu`があります。また、Windows環境向けには`search-s for Namazu`、Tcl/Tkを利用した`tkNamazu`、Emacs上で動作する`namazu.el`など、様々な環境に適した検索クライアントが提供されています。

参考文献


馬場 肇『改訂Namazuシステムの構築と活用』ソフトバンクパブリッシング、2003年、ISBN 4-7973-2338-8

外部リンク


Namazu

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。