天体物理学データシステム(ADS)の概要
天体物理学データシステム(Astrophysics Data System、ADS)は、
アメリカ航空宇宙局(NASA)が開発した、
天文学と
物理学に関する膨大な論文
データベースです。査読済み論文、査読なし論文を含め、1250万件以上の論文を収録しており、
天文学研究において世界的に重要な役割を担っています。
ADSの主要な特徴として、無料でのアクセスが可能である点が挙げられます。多くの論文の要旨は自由に閲覧でき、古い論文については、GIFまたはPDF形式で全文画像が提供されています。新しい論文については、掲載誌の
ウェブサイトへのリンクが掲載されており、通常は購読者のみが全文にアクセスできます。多くの
天文学研究機関はこれらの雑誌を購読しているため、研究者にとってアクセス上の大きな障壁はありません。
ADSは、ハーバード・スミソニアン
天体物理学センターによって運営されています。強力な
検索エンジンを搭載しており、数日、あるいは数週間かかっていた文献調査を数秒で完了できるため、研究効率の大幅な向上に繋がっています。その経済効果は年間数百万ドルに上ると試算されており、
天文学論文の読者数を3倍に増加させたという報告もあります。
ADSの利用統計は、世界的な
天文学研究の動向分析にも役立っています。統計分析の結果、
天文学研究の量は、国の経済規模(GDP)と正の相関があること、国内の
天文学者数もGDPに
比例すること、そしてある国における
天文学研究の総量は、その国のGDPの2乗を人口で割った数値に
比例することが示唆されています。
ADSの沿革
ADSの開発は1980年代末に始まりました。NASAの各研究機関が個別に管理していた
データベースを統合し、ネットワークを通じて一元的に利用できるシステムの構築を目指したものです。
1992年までに、初期の
インターネット技術を用いて
データベースの統合と電子目録化が完了し、研究者はより広範な分野のデータを効率的に検索できるようになりました。
ADS開発の背景には、学術雑誌に掲載される論文の増加に伴い、研究者が最新の成果を全て把握するのが困難になっていたという問題がありました。
1987年の国際会議で、自然言語で扱える電子化された論文要旨
データベースの構築が提案され、翌年にはADSの原型となるシステムが開発されました。
1991年の国際会議では、論文要旨
データベースを
SIMBAD(天体の
名称に関するカタログ)や
Science Citation Index(論文の引用情報索引)と連携させ、天体
名から関連論文を検索できるシステムの構築が議論されました。NASAの論文要旨データの提供も提案され、ADSのネットワーク技術を用いて、NASAデータと
SIMBAD、電子化論文データの連携が実現しました。
1992年には論文要旨頒布サービスが開始され、ADSの原型となる論文要旨
データベースが採用されました。
1993年2月にはADSがネットワークシステムで公開され、まもなく論文要旨頒布サービスが利用の大半を占めるようになりました。同年夏にはADSと
SIMBADの接続が完了し、天体
名による論文検索が大幅に改善されました。これは、
インターネットを介した科学
データベースの国際的な同期利用における最初の事例と考えられます。
1994年初頭には
World Wide Webに移行し、利用者は4倍に増加しました。当初は静止画像化された論文を提供していましたが、
1995年以降、主要な学術雑誌がオンライン版を提供し始めると、ADSは電子版論文へのリンクを提供するようになりました。以来、ADSの利用者数は毎年約2倍のペースで増加しています。現在では、ほとんどの
天文学分野の学術雑誌から論文要旨の提供を受けており、19世紀初頭以降の800万件以上の論文の静止画像が閲覧可能です。世界中に
ミラーサイトが設置され、定期的にデータの同期がとられています。
ADSのデータ
ADSの
データベースには、論文の書誌情報、著者
名、
参考文献、引用情報などの
メタデータが収録されています。これらのデータは当初
ASCII形式で保存されていましたが、
2000年にはXML形式に移行しました。学術雑誌の電子版開始以降、論文要旨は論文出版と同時に、あるいはそれ以前にADSに転送され、全文は購読者向けに提供されています。古い論文は静止画像化され、要旨は
光学文字認識ソフトウェアを使って生成されています。
1995年以前の論文は、多くの場合、全文を無料で閲覧できます。
静止画像化された論文は
TIFF形式で保存され、表示時にはGIF形式、印刷時にはPDFまたは
PostScript形式に変換されます。生成されたファイルはキャッシュに格納され、繰り返し処理が防止されます。
2014年9月時点では、データ量は要旨と索引だけで250GB、画像データを含めると2TBに達しており、今後もデータ量は増加し続けると予想されます。
データベースは当初
天文学文献のみを扱っていましたが、現在は
天文学、
物理学、arXivのプレプリントの3つの
データベースを統合して扱っています。
天文学データベースが最も充実しており、ADS利用の約85%を占めています。論文は掲載誌よりもテーマに基づいて
データベースに振り分けられ、同じ雑誌の論文が複数の
データベースに含まれることもあります。
データベースを分けることで、分野に特化した検索が可能になり、検索語句の重み付けも分野に合わせて最適化されます。arXivのプレプリントデータは毎日更新され、ADSの
検索エンジンの情報を最新の状態に保つのに役立っています。プレプリントは査読されていない可能性があるため、注意が必要です。
ADSのソフトウェアとハードウェア
ADSのソフトウェアは、
天文学のニーズに合わせて特別に開発されたもので、一般的な
データベースソフトウェアにはない柔軟な設定が可能です。プラットフォーム依存性を低く抑える設計となっており、世界中の様々な環境での
ミラーリングが容易になっています。しかし、
天文学分野では
Linuxの利用が多いため、
Linux環境への最適化が進んでいます。
メインサーバは、ハーバード・スミソニアン
天体物理学センターに設置され、CentOS 6.4上で動作しています。世界中に
ミラーサイトが設置され、rsyncソフトウェアを用いてデータの同期が毎週行われています。
ADSの索引
ADSは200以上の学術雑誌からデータを提供されています。複数の情報源からデータを取得し、最も信頼性の高いデータに基づいて書誌情報を作成します。多くの学術雑誌が
TeXや
LaTeXを使用しているため、書誌データの標準化は容易です。書誌データの取り込み、整理、標準化は
Perlスクリプトで行われています。
著者
名の標準化は、世界中に多様な命
名慣習が存在するため、自動化が容易ではありません。ADSは、
天文学分野の著者
名に関する大規模な
データベースを保有し、正確な著者
名変換に役立てています。電子版論文では
参考文献を容易に抽出できますが、静止画像化された論文では
光学文字認識が必要となります。
参考文献と引用情報の一覧が
データベース化され、
データベースに欠けている論文の特定にも役立っています。
ADSの守備範囲
ADSには現在、1250万件を超える論文が収録されています。
天文学の主要学術雑誌は、創刊号から最新の論文まで網羅されています。これらの雑誌が論文の約3分の2を占め、残りはその他の学術雑誌や研究会の講演録などです。主要学術雑誌の
参考文献、引用情報はほぼ完全に網羅されていますが、不完全な部分もあります。
天文学論文であっても、他の分野の論文に引用される場合は、ADSの守備範囲外となる場合があります。
ADSは、論文要旨や天体に関する高度な
検索エンジンを提供しています。
天文学の論文検索に最適化されており、同義語、別称、表記ゆらぎなども考慮されています。著者
名、天体
名、題
名、要旨などから検索できます。
検索エンジンは、同義語の置換、論理演算、検索結果の絞り込みなど、様々な機能を備えています。
著者名検索
名字と
イニシャルで索引付けされ、表記ゆらぎも考慮されています。
天体名検索
SIMBAD、NED、IAUサーキュラーなどのデータと連携し、天体
名や座標からの検索が可能です。
題名・要旨検索
検索語句の前処理を行い、
スペースや句読点、前置詞などを適切に処理します。同義語の置換も実行されます。
同義語の置換
天文学特有の同義語も考慮されています。
英語以外の言語からの検索も可能です。
論理選択
検索条件の論理演算(AND、ORなど)を指定できます。
検索結果の条件付き抽出
発表年、論文の種類、掲載誌などの条件で検索結果を絞り込めます。
ADSの検索結果
検索結果では、論文要旨、
参考文献、引用論文、プレプリントへのリンクなどが提供されます。また、他の利用者が多く閲覧している論文へのリンク(Also-Read)も表示されます。
SIMBADやNEDへのリンクも提供されています。
ADSの天文学への影響
ADSは、
天文学研究の効率化に大きく貢献しています。文献調査にかかる時間を大幅に削減し、論文の読者数を増加させました。経済的な効果も大きく、
天文学研究の年間予算の約5%に相当すると推定されています。国連からもその貢献が評価されています。
ADSを活用した社会学研究
ADSの利用統計は、世界的な
天文学研究の分布や傾向を分析するのに役立っています。利用者の地理的属性から、
先進国の方が
開発途上国よりもADSを多く利用していることが明らかになっています。また、ADSの利用量と国の経済規模との関係、文化圏による研究量の違いなども示唆されています。単著論文の減少、共著論文の増加といった傾向も明らかにされています。
(ここに
参考文献を追加)
関連項目
Bibcode
SIMBAD
外部リンク
NASA ADS: Query Form
ADS help pages