語彙統計学:言語の系譜を解き明かす定量的手法
語彙統計学(lexicostatistics)は、
言語間の関係性を明らかにする
比較[[言語学]]の重要な手法です。この方法は、複数の
言語における共通の
語彙(
語根)の数を定量的に分析し、その類似度から
言語間の系統関係を図表化します。いわば、
言語間の「血縁関係」を数値データに基づいて可視化する技術と言えるでしょう。
従来の
言語比較研究では、専門家の
言語学的知識や直感に頼る部分がありましたが、
語彙統計学は、客観的なデータに基づいて
言語間の関係性を分析できるという大きな利点を持っています。膨大な
語彙データを統計的に処理することで、人間の主観によるバイアスを最小限に抑え、より精緻な
言語系統樹の作成が可能になります。
語彙統計学の中核となる考え方は、
言語の基礎的な
語彙は、比較的安定した速度で変化するという仮定です。この仮定に基づき、共通
語彙の数の多寡から、
言語間の分岐年代を推定する試みがなされています。この分野は「
言語年代学」と呼ばれ、
語彙統計学と密接に関連しています。例えば、二つの
言語が共通して持つ
語彙の数が多ければ多いほど、それらの
言語が分岐したのは比較的最近であると推測できます。逆に、共通
語彙が少なければ、分岐時期はより古いと推測されます。
語彙統計学の発展において、アメリカ合衆国の
言語学者モリス・スワデシュ(Morris Swadesh)の貢献は無視できません。彼は1950年代に発表した論文において、
言語比較研究における
語彙統計学の有効性を示し、この分野の基礎を築きました。スワデシュは、基礎的な
語彙(例えば、人称代名詞、数詞、身体部位に関する単語など)をリスト化し、それらの単語の対応関係を分析することで、
言語間の系統関係を明らかにする方法論を提案しました。
しかし、
語彙統計学は万能ではありません。この手法は、基礎
語彙の変化速度が一定であるという仮定に基づいていますが、実際には、
言語の接触や借用、
語彙変化の速度の不均一性など、様々な要因によって、この仮定が必ずしも成り立たない場合があります。そのため、
語彙統計学による分析結果を解釈する際には、これらの要因を考慮する必要があります。また、
語彙統計学は、
言語間の系統関係を明らかにする一つの手法に過ぎず、他の
言語学的証拠と合わせて総合的に判断することが重要です。
語彙統計学は、特に
オーストロネシア語族のような、広大な地域に分布し、多数の
言語を含む語族の研究において、その有用性を発揮しています。
オーストロネシア語族の拡散史の解明においては、
語彙統計学が重要な役割を果たしており、多数の研究が発表されています。
近年では、計算機技術の発展により、より大規模な
語彙データの分析が可能になり、
語彙統計学はますます高度化しています。計量
言語学という分野も発展しており、統計的手法を駆使した
言語比較研究は、今後も
言語学の発展に大きく貢献していくでしょう。