ウィキデータ(Wikidata)は、
ウィキメディア財団が運営している共同編集型
データベースであり、オープンな知識基盤を目指しています。このプラットフォームは、誰もが自由に利用できるデータを提供することを目的にしており、公に利用可能な情報を蓄積しています。
ウィキデータは、
ウィキベースソフトウェアを用いて機能しており、様々なメディアファイルを関連付ける
ウィキメディア・コモンズの役割を果たすことにも対応しています。
概念と構造
ウィキデータは、トピックや概念、オブジェクトを示す「項目」に集中的に焦点を当てた
データベースとして設計されています。各項目は「QID」と呼ばれるユニークな識別子によって管理されます。例えば、「
政治」はQ7163という番号で認識されます。この方式により、言語を問わずに各項目の基本情報を入力することが可能です。
さらに、各項目にはラベルや説明、同義語からなる文が構成されており、特定の情報を明確にしています。例えば、「
ケンブリッジ」という名称は日本語だけでなく、他の言語でも関連付けられた都市において使われている場合があります。
データの追加と文の構成
ウィキデータでは、情報の追加は文を通じて行われます。文は「
プロパティ」と「値」のペアで構成され、例えば「
牛乳は
白い」という文を作成するときには、項目「
牛乳」に「
色」という
プロパティと「
白」という値を組み合わせます。この
プロパティには、複数の異なる値を持たせることもでき、さらには修飾子や情報源を用いて文の内容を更に特定することも可能です。
語彙素とスキーマ
ウィキデータはまた、「
語彙素」という新たなエンティティタイプを導入しました。これは言語学における
語彙的意味の最小単位として機能し、語形と語義に基づくデータを体系的に保存できる構造を持っています。2019年以降には、エンティティタイプとして「スキーマ」がShEx形式で記述され、より高次の概念の整理が可能となりました。
歴史と発展
この
データベースの構想は、主にアレン人工知能研究所やグーグン・アンド・ベティ・ムーア財団の支持を受け、合計130万ユーロの資金によってスタートしました。
ウィキデータは2012年に初めて発表され、言語間リンクを一元化するためのプラットフォームとして利用され始めました。その後、世界中の様々な言語版
ウィキペディアとの連携を強化しながら、データの質とアクセスを拡充してきました。
クエリサービスとデータの利用
ウィキデータは、2015年に
SPARQLという問い合わせ言語を用いたクエリサービスを導入し、2018年時点で26種類以上のデータ検索ツールが提供されています。利用状況も好評で、Googleなどの企業が
ウィキデータの重要性を認め、他のデータシステムから
ウィキデータへ情報の移行を行った例もあります。
GLAMとのつながり
近年では、図書館や美術館、博物館などのGLAMと呼ばれる文化機関と
ウィキデータとの連携が進み、共通の識別子を通じて多様なデータセットにアクセスすることが容易になっています。
まとめ
ウィキデータは、特定の分野や文化機関と連携しながらウェブ上での知識の広がりを目指したプラットフォームです。
オープンデータとしての特性から、世界中で多くの人々や組織がこの
データベースを利活用し、新たな知識の構築に寄与しています。