Anna's Archiveについて
Anna's Archiveは、2022年に閉鎖されたZ-Libraryの影響を受けて設立されたオープンソースの
検索エンジンです。「アンナ」という名の運営者によって管理されており、様々なシャドウライブラリへのアクセスを提供しています。このプロジェクトは「人類史上最大の真のオープンな図書館」を目指し、あらゆる書籍をデジタル化し、誰もが簡単に利用できるようにすることを目的としています。
このサイトは
著作権のある資料のダウンロードについての責任を負わないと主張しており、その理由は主に
メタデータをインデックス化することにあり、ファイル自体は直接ホスティングされておらず、第三者が提供するダウンロードリンクを紹介しているからです。しかし、このような運営スタイルは、政府や出版社、出版
業界団体から
著作権侵害の対象とされ、度々法的な圧力にさらされています。
起源
Anna's Archiveは、Pirate Library Mirror(PiLiMi)というプロジェクトから分岐したもので、忍者のボランティアによるシャドウライブラリのミラー化を目的とした取り組みとしてスタートしました。2022年9月には、Z-Libraryの完全なコピーを作成し、
著作権法に意図的に違反することを認めた上で、保存を重視した運営を行っていました。数ヶ月後にZ-Libraryが閉鎖された後、AnnaはAnna's Archiveを立ち上げ、当初はZ-LibraryやLibrary Genesisからの情報を集約していました。
ウェブサイトと運営
このサイトは
検索エンジン、
メタ検索エンジン、シャドウライブラリとして機能し、ファイルそのものではなく、外部からのダウンロードリンクを提供するスタイルで運営されています。また、IPFSプロトコルを用いたダウンロードも可能です。サイトの
ソースコードは
パブリックドメインとしてCC0ライセンスで公開されており、データはトレントファイルで配布しているため、ウェブサイトが閉鎖されてもユーザーは情報にアクセスできるように工夫されています。2025年1月15日現在、40,369,782冊の書籍と98,401,746本の論文が含まれ、一部のデータはスクレイピングや非公開の方法で収集しています。
金銭面
Anna's Archiveでは、高速ダウンロードは有料会員のみ利用できるもので、非会員は低速のブラウザ認証によるアクセスを強いられます。これはボットの悪用を防ぐための措置です。また、運営は自らを
非営利団体とし、会費や寄付の多くはサーバーの維持に使用されていると説明しています。
高額な資金やデータを提供した企業には、
大規模言語モデルへのアクセスを許可しており、2025年1月時点で約30社にそのアクセスを与えているとされています。
DeepSeekがこのデータを使ってモデルを訓練したことも報じられています。
合法性の問題
Anna's Archiveは、アメリカ合衆国を含むいくつかの国で法的に問題視されています。アメリカでは、2023年に行われた年次報告書により、
知的財産権の侵害に関与しているとされています。また、OCLCという団体が、このサイトが
WorldCatのデータをスクレイピングしたとして訴訟を起こし、
損害賠償を求めています。このような訴訟に対し、Anna's Archiveは運営者の個人情報を明かさず、法的な対応を行っています。
オランダやイタリア、イギリスでもブロッキングの命令が出されており、さまざまな国で法的な問題が続いています。さらに、Google検索においても多くのDMCA削除要請が出されており、これからも注視が必要な案件です。
結論
Anna's Archiveは、デジタル情報へのアクセスを提供する新しい試みですが、その運営方法には法的なリスクが伴います。
著作権の問題や政府からの圧力の中で、今後どのように進化していくのか、非常に興味深いところです。