Anthy:軽量で歴史あるオープンソース日本語入力システム
Anthyは、LGPL
ライセンスの下で提供されているフリーソフトウェアの
日本語入力システムです。その名前は、人気アニメ『
少女革命ウテナ』の登場人物、姫宮アンシーに由来しています。
開発の歴史
Anthyの開発は、
2000年5月19日、
京都大学マイコンクラブ内のProject Hekeにおいて始まりました。その後、IPA(
情報処理推進機構)の平成13年度未踏ソフトウェア創造事業に採択され、開発は大きく進展します。
2001年7月には開発版、同年11月にはα版がリリースされました。
元開発者による開発は
2007年10月に終了しましたが、その後も開発は継続され、2010年5月からはDebianがAnthyの保守を引き継ぎました。
ソースコードの保守・管理は、元開発者である田畑氏によって継続的に行われています。
2021年には、Anthyプロジェクトの後継として、Anthy Unicodeという派生プロジェクトが有志によって立ち上げられました。Anthyの開発が事実上停止していたことから、Fujiwara氏によって田畑氏に連絡が取られ、Anthy Unicodeの管理について合意に至りました。
Anthyの特徴
Anthyはかな漢字変換ソフトウェアであり、
文字入力にはuim、SCIM、iBus、Tamagoなどの入力メソッド、もしくは付属ユーティリティanthy.elを使用します。CannaやWnnとは異なり、クライアントサーバモデルを採用せず、他のソフトウェアとの通信にはパイプを使用する点が特徴です。
変換アルゴリズムには、A Discriminative Language Model with Pseudo-Negative Samples、Memory Based Reasoning、そしてビタビアルゴリズムが用いられています。漢字変換には、メモリと速度の最適化を図った独自のバイナリ形式辞書を使用しますが、テキスト形式のCanna用辞書にも対応しています。漢字変換辞書にはcannadicが使用されており、Anthyアーカイブに同梱されています。
Anthyは、IA-32 200MHzの
CPUを搭載したマシンでも動作することを想定し開発されており、高いPOSIX準拠性を実現しています。そのため、多くの
UNIX系OSで動作し、ZETAや
Microsoft Windowsへの移植版も存在します。基本的にはX11およびEmacs上で動作し、ひらがなテキストを仮名漢字混じりテキストに変換します。ライブラリとして実装されており、ユーザーの個人情報は~/.anthy/ディレクトリに保存されるため、高いセキュリティを確保しています。
リリース版とバージョン番号
Anthyのバージョン番号は、例えば「9026」であれば、開発開始から90ヶ月と26日目であることを示します。下2桁が「00」のバージョン番号は安定版を表し、ソフトウェアの保守時には「9100a」のようにアルファベットが末尾に追加されます。
オープンソースコミュニティにおけるAnthy
Anthyは、オープンソースの世界で広く知られた入力メソッド(IME)の一つです。Debian Linuxを始め、多くの
Linuxディストリビューションで採用されてきました。同様のオープンソースプロジェクトとしては、後発のMozcが存在し、利用において競合関係にあります。
近年では、Fedora Linuxプロジェクトにおいて、Fedora 34からIBus-Anthyによるかな漢字変換が標準で採用されるなど、その地位を確固たるものとしています。
まとめ
Anthyは、軽量で高速、そして高い互換性を持ち、長年にわたって多くのユーザーに利用されてきた実績のある
日本語入力システムです。オープンソースであるという利点も活かし、今後も進化を続けると期待されます。