語彙統計学:言語の系譜を解き明かす定量的手法
語彙統計学(lexicostatistics)は、
言語間の関係性を明らかにする
比較言語学の重要な手法です。この方法は、複数の
言語における共通の
語彙(
語根)の数を定量的に分析し、その類似度から
言語間の系統関係を図表化します。いわば、
言語間の「血縁関係」を数値データに基づいて可視化する技術と言えるでしょう。
従来の
言語比較研究では、専門家の
言語学的知識や直感に頼る部分がありましたが、
語彙統計学は、客観的なデータに基づいて
言語間の関係性を分析できるという大きな利点を持っています。膨大な
語彙データを統計的に処理することで、人間の主観によるバイアスを最小限に抑え、より精緻な
言語系統樹の作成が可能になります。
語彙統計学の中核となる考え方は、
言語の基礎的な
語彙は、比較的安定した速度で変化するという仮定です。この仮定に基づき、共通
語彙の数の多寡から、
言語間の分岐年代を推定する試みがなされています。この分野は「
言語年代学」と呼ばれ、
語彙統計学と密接に関連しています。例えば、二つの
言語が共通して持つ
語彙の数が多ければ多いほど、それらの
言語が分岐したのは比較的最近であると推測できます。逆に、共通
語彙が少なければ、分岐時期はより古いと推測されます。
語彙統計学の発展において、アメリカ合衆国の
言語学者モリス・スワデシュ(Morris Swadesh)の貢献は無視できません。彼は1950年代に発表した論文において、
言語比較研究における
語彙統計学の有効性を示し、この分野の基礎を築きました。スワデシュは、基礎的な
語彙(例えば、人称代名詞、数詞、身体部位に関する単語など)をリスト化し、それらの単語の対応関係を分析することで、
言語間の系統関係を明らかにする方法論を提案しました。
しかし、
語彙統計学は万能ではありません。この手法は、基礎
語彙の変化速度が一定であるという仮定に基づいていますが、実際には、
言語の接触や借用、
語彙変化の速度の不均一性など、様々な要因によって、この仮定が必ずしも成り立たない場合があります。そのため、
語彙統計学による分析結果を解釈する際には、これらの要因を考慮する必要があります。また、
語彙統計学は、
言語間の系統関係を明らかにする一つの手法に過ぎず、他の
言語学的証拠と合わせて総合的に判断することが重要です。
語彙統計学は、特に
オーストロネシア語族のような、広大な地域に分布し、多数の
言語を含む語族の研究において、その有用性を発揮しています。
オーストロネシア語族の拡散史の解明においては、
語彙統計学が重要な役割を果たしており、多数の研究が発表されています。
近年では、計算機技術の発展により、より大規模な
語彙データの分析が可能になり、
語彙統計学はますます高度化しています。計量
言語学という分野も発展しており、統計的手法を駆使した
言語比較研究は、今後も
言語学の発展に大きく貢献していくでしょう。