Common Voiceとは？意味をやさしく解説 - サードペディア百科事典

Common Voice：多様な音声データでAIを育む

Common Voiceは、Mozillaが立ち上げたクラウドソーシングプロジェクトで、音声認識ソフトウェア開発のための無料データベース構築を目指しています。このプロジェクトは、世界中のボランティアの協力によって支えられています。参加者は、自身のマイクを使ってサンプル文を読み上げ、その音声を録音します。また、他のユーザーが録音した音声の正確性を検証する作業にも参加します。

録音された音声データは、パブリックドメインライセンスであるCC0の下で公開され、自由に利用できる音声データベースに集約されます。このライセンスのおかげで、開発者は音声認識アプリケーションを開発する際に、データの利用制限や使用料の心配なく活用できます。さらに、非公式ではありますが、Androidアプリも利用可能です。

プロジェクトの目的

Common Voiceの主な目的は、多様性に富む音声サンプルを提供することです。Mozillaの発表によると、既存のプロジェクトの多くが、ラジオ番組から収集したデータセットに依存していました。ラジオの出演者は男性や標準的な発音をする人が多いため、女性の声や地域特有の発音、訛りのある音声データが不足するという偏りが見られました。Common Voiceは、このような偏りを是正し、より公平な音声認識技術の開発を目指しています。

音声データベースの規模

Common Voiceの英語版データベースは、自由にアクセスできる音声データベースとして、LibriSpeechに次ぐ規模を誇ります。2017年11月29日に最初のデータが公開された時点では、世界中の2万人以上のユーザーによって、40万件もの検証済み音声が登録され、その合計時間は500時間に及びました。

2019年2月には、最初のコーパスがリリースされました。このコーパスには、英語、フランス語、ドイツ語、中国語といった主要言語に加え、ウェールズ語やカビル語など、少数言語の音声データも含まれています。総計で、42,000人以上の貢献者による、約1,400時間分の録音データが提供されています。

2020年12月現在、データベースには60言語、9,283時間分の音声記録が蓄積されており、そのうち7,335時間分はボランティアによって検証済みです。このデータは、音声認識技術の開発に大きく貢献しています。

外部リンク

Common Voice

もう一度検索

Common Voice

Common Voice：多様な音声データでAIを育む

プロジェクトの目的

音声データベースの規模

関連するプロジェクト

外部リンク