Solr(ソーラー)は、
Apacheソフトウェア財団のLuceneプロジェクトのサブプロジェクトとして開発されている、オープンソースの
全文検索システムです。
概要
Solrは、
全文検索エンジンライブラリであるLuceneをベースに、管理画面やキャッシュ機構を組み込んだアプリケーションです。主な特徴として、以下の点が挙げられます。
ファセット検索: 検索結果を特定の軸で
クラスタリングし、各グループの件数を表示するファセット機能により、ユーザーは目的の情報を効率的に絞り込むことができます。この機能は、商用検索エンジンでも搭載しているものが少ない高度な機能です。
高い拡張性: 内部構造が
コンポーネントに分割され、プラグイン機構が各所に設けられているため、柔軟な機能拡張が可能です。また、様々なキャッシュ機構により、大量の検索クエリを効率的に処理できます。
DataImportHandler (DIH): v1.3で追加されたDIH機能を使用すると、Oracleや
PostgreSQLなどのデータベースからJDBC経由で直接、検索対象の文書データを取り込むことができます。これにより、データソースとの連携が容易になり、検索システムの構築がより便利になりました。
開発
Solrは、2007年1月にインキュベータレベルから卒業し、Luceneのサブプロジェクトとして正式に活動を開始しました。2007年6月6日にはv1.2が公開され、その後、2008年9月17日に公開されたv1.3からは日本人のコミッタも開発に参加し、2バイト文字や半角カナへの対応など、日本語環境への対応が積極的に進められています。
リリース
Solrは、頻繁にバージョンアップが行われており、最新の機能やバグ修正が提供されています。詳細なリリース情報については、公式ページを参照してください。
事例
Solrは、その高い性能と柔軟性から、国内外の様々な企業やWebサイトで利用されています。具体的な事例としては、以下のようなものが挙げられます。
国外: 小中規模のニュースサイトに加え、大規模なソーシャルニュースサイト
Diggや
インターネットアーカイブなど、非常に多くのサイトで採用されています。また、IBM WatsonのRetrieve and Rank、Microsoft AzureのLog Analytics、SAPのHybris、Salesforceの検索機能など、大手ベンダーもSolrを基盤としたサービスを提供しています。
国内: SHOOTIでは、約2億件のWebページのインデキシングにSolrが利用されています。
さらに、以下のような製品やサービスにもSolrが活用されています。
アスベル: VMwareで動作する仮想化検索アプライアンス。
FileBlog: Windowsファイルサーバー向けのWeb文書共有・検索・属性管理システム。
RONDHUIT Solrサブスクリプション: Lucene/Solrプロジェクトの日本人コミッタが設立したロンウイット社が提供するSolrのサポートと日本語関連機能拡張パッケージ。
SMART/InSight G2 Open: スマートインサイト社の検索アプリケーション。Solrを利用して、複数のデータベース、ファイルサーバー、Webサイトなどを統合的に検索し、結果をグラフィカルに表示します。
Neuron: ブレインズテクノロジー社のエンタープライズサーチ。Solrをベースに、企業内文書の高速検索を実現します。
Next-L Enju: オープンソースの統合図書館システム。
全文検索エンジンとしてSolrを利用しています。
脚注
Solrは、継続的に開発が進められており、新しい機能や改善が日々行われています。公式サイトや関連ドキュメントを参照することで、最新情報を得ることができます。
外部リンク
Solr(本家)
Solr(wiki)
Solr(開発者)
Solr(事例集)
ロンウイット社