孤
語(こご)、またはハパックス・レゴメノン(hapax legomenon)とは、言
語学において、特定のテキストや
コーパス内で、ただ一度だけ出現する単
語のことです。この用
語は、
ギリシア語の「ἅπαξ λεγόμενον(一度だけ言われた)」に由来し、テキスト分析における重要な概念となっています。
孤語の定義
孤
語は、特定の言
語資料(
コーパス)全体、あるいは特定の著者による作品群、特定のテキストといった一定の文脈の中で、出現頻度が一度に限られる単
語を指します。時には、ある作家の特定の作品中にのみ見られる単
語を、その作品内で複数回出現していても「孤
語」と呼ぶことがあります。これは、本来の定義とは異なる誤用であることもあります。
関連する用語
孤
語に関連する表現として、「ディス・レゴメノン(dis legomenon)」、「トリス・レゴメノン(tris legomenon)」、「テトラキス・レゴメノン(tetrakis legomenon)」があります。それぞれ、2回、3回、4回出現する単
語を指しますが、これらは実際にはあまり使われません。
孤語の出現頻度
孤
語は、言
語資料においてごく一般的な現象であり、
ジップの法則が示すように、単
語の出現頻度はその頻度順位に反比例します。大規模な
コーパスでは、全単
語のうち約40%から60%が孤
語として観測され、2回しか出現しない「ディス・レゴメノン」も10%から15%程度存在すると言われています。例えば、
アメリカ英語のブラウン・
コーパスでは、約半数の5万
語がこの
コーパスの範囲内において孤
語です。
孤語と臨時語
孤
語は、あくまでテキスト内での出現頻度によってのみ規定されるものであり、その単
語の起源や話し言葉での使用頻度などは考慮されません。そのため、孤
語は、全く記録に残らないこともあれば、特定の範囲で通用すること、広く記録されることもありえます。また、ある作品の中で何度も使用され、それが定着のきっかけとなるような臨時
語(nonce word)とは異なる概念です。
孤語の重要性
孤
語は、テキストの分析において様々な情報を提供してくれます。例えば、特定の単
語がなぜ一度しか使われていないのか、それが偶然なのか意図的なのかを考察することで、テキストの理解を深めることができます。また、文学作品などにおいては、作者が意図的に使用した珍しい単
語である可能性も考慮することで、作品の解釈に役立つこともあります。孤
語の分析は、言
語学だけでなく、文学、歴史学など、様々な分野における研究に活用されています。
まとめ
孤
語は、言
語資料の中で一度しか出現しない単
語であり、言
語研究において重要な役割を担っています。その出現頻度から、テキストの特性や作者の意図を読み解く手がかりとなり得ます。
参考文献
コーパス言
語学に関する文献
テキスト分析に関する文献
関連項目
*
幽霊語