中国哲学書電子化計画:膨大な中国古典へのデジタル・ゲートウェイ
中国哲学書電子化計画(CTP、ctextなどとも略称される)は、
ハーバード大学と
ダラム大学で活躍した
中国学者、ドナルド・スタージョン博士によって設立された、世界的に知られたオンライン
電子図書館です。その目的は、中国古典、特に
中国哲学関連の
文献をデジタル化し、世界中の研究者や一般の人々がアクセスできるようにすることです。
アクセスと内容の豊富さ:
CTPは、
インターネットを介して誰でも自由にアクセスできます。
英語と
中国語(
繁体字と
簡体字)に対応しており、膨大な量の中国古典籍を収録しています。「
先秦~漢代」と「漢代以降」の2つのセクションに分けられ、それぞれ
諸子百家や時代順に整理されています。収録
文献の
文字数は、前者が500万字以上、後者が2000万字以上にのぼります。さらに、ユーザーが編集可能な
ウィキ形式のページも備え、その
文字数は50億字以上に達します。
多様な機能と利便性:
CTPの大きな特徴は、その充実した機能にあります。
多言語対応と翻訳: 『
論語』など主要
文献には、
英語と現代
中国語の
翻訳が用意されており、原
文と
翻訳を並べて読むことができます。
翻訳は、著作権が切れたものや、現代の学者の承諾を得たものを利用しています。これにより、古典
中国語に不慣れな人でも容易に理解を進めることができます。
高度な検索機能: カスタム
検索、字書機能、近似
文字列
検索、
コーパス検索、
メタデータ検索、
注釈閲覧など、研究者にとって不可欠な機能が充実しています。
コミュニティ機能: 参考文献や
先行研究の情報へのアクセス、スレッド形式の掲示板による議論参加も可能です。
影印本の閲覧: 「Library」セクションでは、2500万頁以上に及ぶ原典
文献の
影印本を閲覧できます。これは、OCRによる翻刻における
誤字を検証する上で特に重要です。
*
APIとデータ利用: 文献データと
メタデータはAPIを通じて抽出可能であり、他のツールとの連携や、
テキストマイニング、デジタル・ヒューマニティーズ研究での二次利用が許可されています。
OCRとユーザー参加:
CTPは、
光学文字認識(OCR)技術を用いて
文献の翻刻を行っているため、翻刻
文には
誤字が含まれる場合があります。しかし、
影印本で原
文を確認したり、
ウィキ形式の編集機能を通じてユーザーが
校正・編集を行うことが奨励されています。これは、
クラウドソーシングによる質の高い
データベース構築を目指した取り組みです。
研究への貢献:
CTPは、中国古典研究に革命をもたらす可能性を秘めたプロジェクトです。デジタル化された膨大なデータと高度な
検索機能は、従来の方法では不可能だった大規模なテキスト分析や比較研究を可能にします。また、APIによるデータ提供は、デジタル・ヒューマニティーズ研究の進展にも大きく貢献するでしょう。
まとめ:
CTPは、その規模、機能、アクセシビリティにおいて、類を見ない貴重なリソースです。中国古典に興味を持つ全ての人々にとって、まさにデジタル時代の必須ツールと言えるでしょう。 初心者から専門家まで、様々なレベルのユーザーにとって、研究や学習を深めるための強力なプラットフォームを提供しています。