ハルシネーション(AIの幻覚)
人工知能(AI)の「ハルシネーション」とは、AIが現実の情報とは異なる虚偽の内容を信じられる事実として提示する現象を指します。この現象は、特に
大規模言語モデル(LLM)を使用する
チャットボットで顕著です。ハルシネーションは、人間が抱く幻覚と異なり、AI内部のモデルが誤った情報を生成することを意味しています。
ハルシネーションの定義と背景
「ハルシネーション」という用語は、もともとは
精神医学用語であり、感覚器官を通じて存在しないものを真実の
知覚と誤認する際に使用されます。AIにおいては、モデルが提供されたデータと一致しない情報を作成することを示しています。一部の研究者は、この用語の使用に対し、AIを擬人化していると批判し、「
作話」という表現を好むようです。
この概念は、2000年代初頭にコンピュータビジョンの分野で使われ始め、その後2010年代に入り、主に翻訳や物体認識の文脈で扱われるようになりました。近年、LLMの発展に伴い、特に
ChatGPTのような会話型AIが普及する中で、ハルシネーションの問題は広く認識されるようになりました。2021年にはMetaが、「BlenderBot 2」がハルシネーションを起こしやすいことを警告したことがあり、
2022年にはより多くのユーザーがAIの生成する信じられる虚偽の内容に戸惑いを示しました。
ハルシネーションの原因と影響
ハルシネーションが発生する背後には、いくつかの要因があります。主な原因は、トレーニングに使用されたデータの不一致や、そのデータに基づいて推論・生成される時のモデルの性質から生じるものです。
具体的には、以下のような分類がされています:
- - データに基づくハルシネーション:学習データに矛盾がある場合に発生します。
- - モデリングによるハルシネーション:モデルが生成過程において自然に誤情報を生じる場合です。
これにより、AIは一見もっともらしく見えるが、実際には誤った情報を生成するため、利用者がその情報を無条件に信じる危険性があります。特に教育や医療などの重要な分野では、誤った情報が重大な影響を与える可能性があるため深刻な問題です。
事例や影響の実証
これまでに、
ChatGPTを含む多くのAIシステムが生成するコンテンツ内に嘘が含まれる事例が多く報告されています。一つの事例では、
ChatGPTが存在しない書籍を引用したり、架空の人物についての情報を提示したりしました。また、2017年にはGoogleの研究者もニューラル機械翻訳の結果が原文と異なる場合があることを示唆しています。
特に研究分野においては、AIモデルが虚偽の文献を引用したり、誤った情報を提供したケースがいくつも記録されています。例えば、ある研究では178件の参考文献のうち、69件が実際には存在しない入手不能なものであることが判明しました。このようなハルシネーションは学術研究の信頼性を大いに損なう要因となっています。
現状と展望
現在、AI技術の発展に伴い、ハルシネーション問題への関心はますます高まっています。2023年には、多くの研究者や報道機関がAIモデルによるハルシネーションを深刻な問題として認識しており、これを避けるための改善策や修正方針が求められています。AIの利用が進む中で、その信頼性や正確性を維持するためには、利用者自身が生成された情報の真偽を慎重に確認する必要があります。
結論
AIによるハルシネーションは、新たな技術がもたらす可能性とリスクを同時に浮き彫りにしています。この問題に対処しつつAIを安全に利用するためには、技術の理解を深め、正確な情報を提供するための努力が不可欠です。ハルシネーションの軽減に向けた研究が進む中、AIの発展と利用における倫理的な視点も重要なテーマとして浮上しています。