ISO 639-3

ISO 639-3:2007は、[国際標準化機構]が2007年に公表した言語コード体系です。既存のISO 639-2を拡張し、世界中のあらゆる自然言語を網羅することを目的としています。

網羅性と包括性

ISO 639-3は、言語の存続状況(現存、消滅、古代語、人工言語)、話者数、書記体系の有無に関わらず、可能な限り多くの言語を登録しています。ただし、インド・ヨーロッパ祖語のような再建言語は除外されます。この包括的なアプローチは、言語の多様性を尊重し、あらゆる言語に等しい機会を与えるという理念に基づいています。Ethnologue(エスノローグ)と呼ばれるSIL国際(登録主体)が出版する言語コードリストが、言語範囲の規定の主要な基盤となっています。

適用範囲と重要性

ISO 639-3は、情報技術、特にインターネットなどの多言語環境を支える基盤技術として広く活用されています。また、言語学研究においても、言語名の曖昧性解消や多義性の排除に役立ちます。情報技術における広範な採用は、世界的な情報格差の是正にも貢献しています。

言語コード体系

ISO 639-3のコードは3文字のアルファベットから構成され、最大17,576件の言語を識別できます。ISO 639-1の定義を踏襲しつつ、ISO 639-2とは異なる体系を採用しています。ISO 639-2では言語グループにもコードが割り当てられていますが、ISO 639-3は単一言語を対象とし、ISO 639-2の上位集合ではありません。また、ISO 639-2で使用されているBコードとTコードのうち、ISO 639-3ではTコードのみを使用します。

マクロランゲージと集合的言語

ISO 639-3では、ISO 639-2で複数の言語をまとめて扱っていたものを「マクロランゲージ」として再定義しています。例えば[アラビア語]は、ISO 639-2では単一コードでしたが、ISO 639-3では標準[アラビア語]など複数の個別コードに細分化されています。これは、言語学的には異なる言語であっても、話者らが同一言語の変種とみなす場合を反映したものです。一方、集合的言語コードとは、複数の個別言語のグループを表すもので、ISO 639-3ではISO 639-2と異なり、これらのコードは使用されません。

汎用コード

ISO 639-3では、特定のコードが当てはまらない場合に使用する汎用コードも定義されています。例えば、`mis`はISO標準にまだ含まれていない言語、`mul`は複数の言語が混在する場合、`und`は言語が不明な場合、`zxx`は言語以外のデータ(動物の鳴き声など)に使用されます。

コードの保守

ISO 639-3のコード表は、厳格なプロセスに従って保守されています。変更は年1回行われ、変更要求は3か月間の公開レビュー期間を経て承認されます。変更の対象は、参照情報の変更、項目の追加、重複項目の非推奨化、項目の統合・分割などです。SIL国際のウェブサイトでは、変更要求のプロセスや提出方法が公開されています。

批判と課題

ISO 639-3は、その包括性と標準化への貢献から高く評価されていますが、同時にいくつかの批判も受けています。言語コード自体の問題、SIL国際の管理体制、言語変化への対応、言語と方言の区別などについて議論がなされています。特に、コードが言語話者にとって侮辱的な意味を持つ場合や、言語の分類に主観が入り込む可能性がある点が指摘されています。

日本の言語とISO 639-3

日本語はISO 639-1とISO 639-2の両方で、アイヌ語はISO 639-2でコード化されています。

使用例

ISO 639-3は、Ethnologue、Linguist List、OLAC、IETF言語タグ、Lexical Markup Framework、UnicodeのCLDR、Microsoft Windowsなど、さまざまなシステムやデータベースで広く使用されています。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。