ユニバーサル・ネットワーキング・ラングエッジ(UNL)とは
ユニバーサル・ネットワーキング・ラングエッジ(UNL)は、自然言語の文から抽出された意味情報を表現するために設計された
形式言語です。言語に依存しない形で意味を表現することで、多言語間の機械翻訳(特にピボット言語方式)や、
情報検索における知識表現言語としての利用を目指しています。
UNLの目的とスコープ
UNLの活動は、機械言語や人間言語に依存しない形式で、情報や意味の普遍的な概念を表現することを目標としています。UNLは、情報のコード化、保管、そしてUNL化の普及を通じて、あらゆる言語で書かれた文書から情報を抽出可能にすることを目指しています。これにより、言語の障壁を取り除き、グローバルな情報アクセスを容易にすることを目指しています。
一見すると、UNLは多言語機械翻訳システムにおける中間言語(インターリングア)のように見えます。確かに、その目的で利用することも可能ですが、UNLの本質は知識を表現することにあります。UNLは、既存の知識を処理し、あらゆる言語への変換を可能にする基盤となることを目指しています。
言葉の意味は時間とともに変化し、微妙なニュアンスや解釈は主観的です。UNLは、単語や文の「完全な意味」を表現しようとするのではなく、高頻度で「中心的」または「通念」と捉えられる意味の表現に焦点を当てています。そのため、詩的な表現や比喩、複雑なコミュニケーションは、UNLの現在のスコープ外となります。UNLが重視するのは、直接的なコミュニケーションと文字通りの明確な意味、つまり日常的なコミュニケーションにおける実用的な側面です。
UNLの構造
UNLでは、自然言語が伝える情報を文単位でハイパーグラフを用いて表現します。ハイパーグラフは、関係子と呼ばれる有向バイナリラベルが付いたリンクの集合で構成され、ノードまたはハイパー・ノード(ユニバーサル・ワード, 略称UW)間の概念を表します。UWは、コンテキスト情報を表現する属性によって注釈を付けることができます。
例えば、英文の「The sky was blue?!」のUNL表現は以下のようになります。
[aoj] sky(icl>natural world), blue(icl>color)
@def @interrogative @past @exclamation @entry
ここで、「sky(icl>natural world)」と「blue(icl>color)」は、それぞれ概念を表しています。これらの概念は、UW間の関係を示す関係子「aoj」(attribute of an object)によって繋がれています。また、「@def」、「@interrogative」、「@past」、「@exclamation」、「@entry」は、UWに追加情報を加える属性子です。
UWは、人が理解しやすいように英語やその他の自然言語を用いて普遍的な概念を表現します。UWは、ルートである「headword」と、括弧内に付記される「constraint list」で構成されます。この「constraint list」は、「headword」が伝える概念の曖昧さを解消する役割を果たします。UWの集合は、オントロジーのような構造、すなわちUWシステムに整理されており、「icl」(is an instance of)、「iof」(is a kind of)、「eof」(is equal to)といった関係子によって、上位概念が下位概念の曖昧さを解消します。
関係子は、あらゆる言語における語(句)の意味的なリンクを表します。オントロジー的な関係子に加えて、「and」、「or」のような論理関係や、「agt」(agent)、「ins」(instrument)、「tim」(time)、「plc」(place)などの主題を表す関係子があります。現在のUNL仕様では、46種類の関係子が定義されており、UNLの統語を規定しています。
属性子は、UWの関係子だけでは表現しきれない情報を伝えます。通常、時間(「@past」、「@future」など)、特性(「@def」、「@indef」など)、モーダル(「@can」、「@must」など)、焦点(「@topic」、「@focus」など)を表します。
自然言語の文をUNLグラフに変換することをエンコンバート、UNLグラフから自然言語を生成することをデコンバートと呼びます。エンコンバートは、自然言語の解析と理解を伴うため、コンピュータ支援で人手を介して行われますが、デコンバートは完全自動化される見込みです。
UNLの歴史
UNLプログラムは、1996年に
国際連合大学高等研究所のイニシアチブで発足しました。2001年1月には、UNLプログラムの開発と管理を目的として、独立運営組織であるUNDL財団が設立されました。財団は国連の関連機関でありながら、
国際連合大学から独立した非営利の国際機関です。UNU/IASからUNLプログラムを引き継ぎ、そのミッションを遂行しています。UNDL財団の本部はスイスのジュネーブにあります。
プログラム発足当初から、世界各国の大学研究者連合がUNL開発に参加しており、このコミュニティはUNLソサエティと呼ばれています。約200名のコンピュータサイエンスおよび言語学の専門家が、言語リソースの作成やUNLシステムの開発に携わっています。プログラム実施の技術的なサポートとコーディネートは、UNLセンターが行っています。
UNLプログラムは、これまでに多くの実績を上げています。UNLシステムのアーキテクチャはほぼ完成し、基本的なソフトウェア群とツール群はテストと改良の段階に入っています。様々な言語のネイティブから収集された膨大な言語リソースとUNL表現体系の蓄積があり、これらを拡張する技術基盤も整備されています。今後、さらに多くの言語がUNLシステムに参加することが期待されます。UNLに関する学術論文や書籍の発行数も増加傾向にあります。
特に重要な成果として、2002年5月にUNLの革新性と産業界への適用性が
世界知的所有権機関(WIPO)に認められ、特許協力条約(PCT)の手続きを経て認定特許を取得しています。これは国連による革新的な成果であり、UNLが持つ可能性を裏付けるものです。
関連項目
意味ネットワーク
Abstract semantic graph
Semantic translation
Semantic unification