Common Voice

Common Voice:多様な音声データでAIを育む



Common Voiceは、Mozillaが立ち上げたクラウドソーシングプロジェクトで、音声認識ソフトウェア開発のための無料データベース構築を目指しています。このプロジェクトは、世界中のボランティアの協力によって支えられています。参加者は、自身のマイクを使ってサンプル文を読み上げ、その音声を録音します。また、他のユーザーが録音した音声の正確性を検証する作業にも参加します。

録音された音声データは、パブリックドメインライセンスであるCC0の下で公開され、自由に利用できる音声データベースに集約されます。このライセンスのおかげで、開発者は音声認識アプリケーションを開発する際に、データの利用制限や使用料の心配なく活用できます。さらに、非公式ではありますが、Androidアプリも利用可能です。

プロジェクトの目的



Common Voiceの主な目的は、多様性に富む音声サンプルを提供することです。Mozillaの発表によると、既存のプロジェクトの多くが、ラジオ番組から収集したデータセットに依存していました。ラジオの出演者は男性や標準的な発音をする人が多いため、女性の声や地域特有の発音、訛りのある音声データが不足するという偏りが見られました。Common Voiceは、このような偏りを是正し、より公平な音声認識技術の開発を目指しています。

音声データベースの規模



Common Voiceの英語データベースは、自由にアクセスできる音声データベースとして、LibriSpeechに次ぐ規模を誇ります。2017年11月29日に最初のデータが公開された時点では、世界中の2万人以上のユーザーによって、40万件もの検証済み音声が登録され、その合計時間は500時間に及びました。

2019年2月には、最初のコーパスがリリースされました。このコーパスには、英語フランス語、ドイツ語、中国語といった主要言語に加え、ウェールズ語やカビル語など、少数言語の音声データも含まれています。総計で、42,000人以上の貢献者による、約1,400時間分の録音データが提供されています。

2020年12月現在、データベースには60言語、9,283時間分の音声記録が蓄積されており、そのうち7,335時間分はボランティアによって検証済みです。このデータは、音声認識技術の開発に大きく貢献しています。

関連するプロジェクト



Common Voiceの他にも、音声データに関する以下のようなプロジェクトがあります。

Forvo: 発音に特化した辞書サイトで、世界中の様々な言語の発音を聴くことができます。
Lingua Libre: フリーな音声データベース構築プロジェクトで、様々な言語の音声を収集しています。
クラウドソース (アプリ): Googleが提供するクラウドソーシングアプリで、言語に関するタスクを支援します。

外部リンク



Common Voice

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。