Text Encoding Initiative

Text Encoding Initiative(TEI)とは



Text Encoding Initiative(テキスト・エンコーディング・イニシアティブ、略称 TEI)は、人文学分野におけるデジタル資料の構造化と記述のための国際的な標準規格を策定するプロジェクトです。このプロジェクトは、人文学資料の多様なテキスト構造とメタ情報をデジタル化し、機械可読な形式で記述することで、異なる環境間で効率的に共有することを目的としています。

TEIは、基盤技術としてXMLを採用しており、テキストデータのマークアップを通じて、書誌情報、テキスト構造、解釈、異読、その他の付帯情報を詳細に記述できます。マークアップの深さは記述者の任意で、段落レベルから脚注レベルまで、様々な詳細度での記述が可能です。言語コーパスのように単語の属性に着目した記述や、古典文献学のように書誌情報や異文に着目した記述など、多様な分野に対応できます。特に、厳密な学術利用に耐えうる構造化を実現したものは、デジタル学術編集版(Digital Scholarly Edition)と呼ばれることがあります。

この標準は、主に人文学者、情報工学者、図書館情報学者、専門司書などが協力して作成しており、コミュニティ駆動型で発展を続けています。すべての資料に完全に適用できるわけではなく、また、工業標準のように固定されたものでもありません。技術の発展とコミュニティの拡大に合わせて、その適用範囲は広がっています。

TEIガイドライン



TEIガイドラインは、XMLのタグ(要素)の種類や属性を定義し、それらの関係性を規定するものです。ガイドラインの内容は、散文形式で解説されるとともに、スキーマ(DTD、RelaxNGなど)としても提供されており、スキーマファイルは日本語化もされています。

また、用途に合わせてタグをモジュール化しており、言語学、辞書、書誌学、校訂テクストなど、必要なタグを柔軟に選択できます。ガイドライン自体がTEIを用いて記述されており、この単一のソースファイルから、解説、スキーマの断片、リファレンスドキュメントが生成されています。この仕組みはODD("One Document Does it all")と呼ばれており、TEIガイドライン内のtagdocsモジュールによって実現されています。

現在の最新版は2007年にリリースされたP5で、その後もGitHubリポジトリを通じて継続的に改訂が行われています。また、簡易なタグセットとしてTEI Liteが提供されているほか、図書館の大規模デジタルアーカイブを想定した、マークアップの深さをレベルで選択できるBest Practices for TEI in Librariesというサブセットもあります。

TEIコンソーシアム



TEIは、1987年にいくつかの学術団体の助成を受けて開始され、プロジェクトの成功を受けて、2000年に国際的なメンバーシップ組織であるTEIコンソーシアムが設立されました。現在は、このコンソーシアムがプロジェクトの運営を担っています。

TEIコンソーシアムは、TEIガイドラインの維持、開発、普及活動を目的として、技術部会の運営、カンファレンスの開催、公式ホームページの運営、ジャーナルの発行、メーリングリストの運営、TEI利用のためのツールチェーンの開発・提供などを行っています。

日本での取り組み



日本は、TEIの初期段階から関与していましたが、その後は個人的な関与にとどまり、TEIを知る研究者は少なくなっていました。しかし、最新版のTEI P5では、外字を扱うためのモジュール「gaiji」が用意されるなど、東洋の文献への適用も現実的になってきています。

2016年には、TEIコンソーシアム内に日本語資料に対応するための環境を整備する東アジア/日本語分科会が設立され、日本でのTEI活用への機運が高まっています。2018年には、欧米以外で初めてとなる東京でのTEIカンファレンスが開催されました。

まとめ



TEIは、人文学資料のデジタル化において重要な役割を果たす標準規格です。その柔軟性と拡張性により、様々な分野の研究者が、自身のニーズに合わせてテキストデータを構造化し、共有することが可能になります。今後、日本におけるデジタル・ヒューマニティーズ研究の発展においても、TEIの活用がますます重要になると考えられます。

参考文献



京都大学人文科学研究所・共同研究班「人文学研究資料にとってのWebの可能性を再探する」編; 永崎研宣著 『日本の文化をデジタル世界に伝える』 樹村房、2019年。
ルー・バーナード, キャサリン・オブライエン・オキーフ, ジョン・アンスワース編; 明星聖子, 神崎正英監訳 『人文学と電子編集』 慶應義塾大学出版会、2011年。

関連項目



デジタル・ヒューマニティーズ

外部リンク



TEI Consortium 公式ホームページ

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。