データ保存とは
データ保存とは、データの安全性と完全性を維持するための活動全般を指します。これは、データが持つ価値を保護し、長期にわたって利用可能にするために不可欠なプロセスです。単にデータを保管するだけでなく、データの真正性を保証し、紛失や破損から守るための組織的な取り組みが求められます。
歴史的背景
歴史を振り返ると、多くの貴重なデータが失われてきました。戦争、自然災害、保管資源の欠如、管理体制の不備など、様々な要因が複合的に絡み合い、データの消失を引き起こしてきました。特に科学研究や学位論文のデータは、その重要性が十分に認識されていなかったため、多くが失われたと考えられています。しかし、現代ではデータ保存の重要性が広く認識されるようになり、そのための様々な方法と組織が登場しています。
デジタルデータ保存の初期は1950年代に遡ります。フラット構造や階層構造のストレージが登場し、保管コストの削減とアクセス性の向上が図られました。1970年代には
関係データベースやスプレッドシートが登場し、構造化されたデータの管理が効率化されました。近年では、非
関係データベースも登場し、非構造化データの保存も可能になっています。
データ保存の重要性
データは、政府、企業、アート作品など、あらゆるものが対象となり、その消失は人類の歴史の損失に繋がります。データの損失は、個人的な範囲にとどまらず、環境保護、医学研究、国家安全保障、公衆衛生、経済開発、文化など、社会全体に大きな影響を及ぼす可能性があります。データ損失の原因は、災害、戦争、データ漏洩、過失、自然劣化など多岐にわたります。
例えば、米国地質調査所は、自然災害や天然資源に関する膨大なデータを収集・保存しており、これらのデータは土地利用計画や管理に活用されています。この事例からも、データ保存の重要性が理解できるでしょう。
関連する概念
データ保有
データ保有とは、長期保存を目的としない、一時的なデータの保管を指します。例えば、個人のファイルコレクションやバックアップデータなどが該当します。これは、データが失われた際に用いられる管理手法の一つです。
データリテンション
データリテンションとは、データを使い続けることを指し、データ保存とは異なります。リテンション方針は、データを削除すべきタイミングやアクセス制限について言及することが多いです。一方、保存方針は、データの永続性とアクセス可能性を重視します。
データ保存
データ保存は、単にデータを所有するだけでなく、災害や技術変化に備え、データへのアクセスを保証する取り組みです。バックアップやリカバリの仕組みを整備し、データの長期的な保全を目指します。
データ保存の手法
デジタル保存
デジタル保存は、デジタルデータに特化した保存手法です。技術的な故障や変化に対応し、デジタルデータを継続的に利用可能にすることを目的としています。技術の急速な進化に伴い、ソフトウェアの互換性が失われるリスクを考慮し、データの完全性を保ちつつ、新しい技術でもデータにアクセスできるよう対策を講じる必要があります。
アーカイブズとは、歴史的な文書や記録の集合であり、データ保存に重要な役割を果たします。
アーカイブズは、データを適切に組織化し、
メタデータを付与することで、データの意味を保持します。臨床試験や研究データなどをまとめた LONI Image Data Archive がその一例です。
目録、ディレクトリ、ポータル
目録、ディレクトリ、ポータルは、各機関が保有するデータや
アーカイブデータを集約したものです。これらのツールは、
メタデータの集合体として機能し、データへのアクセスを容易にします。
リポジトリ
リポジトリとは、
アーカイブデータや保有データを保管し、アクセスを可能にする場所です。リポジトリは、データの完全性を保証し、利用者の信頼を得ることを目指します。リポジトリには、単一拠点のものと複数拠点のものが存在します。
単一拠点のリポジトリ
全てのデータセットを単一の拠点で保有するリポジトリです。オランダの Data Archiving and Networking Services (DANS) がその例として挙げられます。
複数拠点のリポジトリ
複数の拠点でデータセットを保有するリポジトリです。OpenAIRE がその一例で、EU諸国が協力して研究データや刊行物を保有しています。
信頼に足るデジタルリポジトリ
長期的なアクセス保証を目指すリポジトリであり、Open Archival Information System 参照モデルに準拠しています。アイルランドの Digital Repository of Ireland がその例です。
サイバーインフラ
サイバーインフラは、ハードウェア、ソフトウェア、方針、サービスなどから構成され、データの共有を促進する基盤です。カナダの Canadian Geo-spatial Data Infrastructure がその例です。
関連項目
デジタル・キュレーション
デジタル保存
* データ管理
まとめ
データ保存は、過去から未来へと、人類の知識や情報を継承するために不可欠な活動です。デジタル技術の進歩に伴い、データ保存の方法も進化し続けており、私たちはより確実にデータを保護し、活用していく必要があります。