當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Mozilla “Common Voice” 开源语音识别项目

發布時間：2025/3/18 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 Mozilla “Common Voice” 开源语音识别项目小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

語音識別技術可能會徹底改變我們與機器的交互方式，但通常技術開發代價昂貴，而且有專利上的使用限制。大多數語音識別技術都被封鎖在少數的大公司內。Mozilla認為這樣會阻礙創新，因此它發起了“Common Voice”這一開源語音識別項目。

在“Common Voice”項目中，你可以捐獻語音到一個大型數據庫里，這些語音會被用于構建開源的語音識別引擎，任何人都可以訪問這些數據從而輕松又快速地訓練基于語音的應用程序。通過“Common Voice”，程序員們可以開發很多有趣的應用程序，如實時語音翻譯、基于語音的管理助手等等。用戶也可以幫助驗證語音，根據顯示的文本判斷聽到的語音是否正確，該判斷結果也會被用于改進語音識別模型。

Mozilla計劃從2017年六月份開始收集總時長約10,000個小時的語音（這是訓練一個語音文本轉換系統所需要的數據量），之后會開源語音數據庫。目前的源文本來自人們的捐獻，以及一些公開的電影劇本，如電影“風云人物”（It's a Wonderful Life）。考慮到實際生活中人們的語音變化多樣，Mozilla希望能收集到多樣化的語音，讓語音識別引擎能夠準確無誤地處理不同場景下的語音，比如帶有背景對話聲、汽車噪音、風扇噪音的場景。在將來，Mozilla有可能會將該語音識別引擎集成到Firefox中。

該項目在Github上的鏈接：https://github.com/mozilla/voice-web

查看英文原文：?Project Common Voice

感謝蔡芳芳對本文的審校。

給InfoQ中文站投稿或者參與內容翻譯工作，請郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博（@InfoQ，@丁曉昀），微信（微信號：InfoQChina）關注我們。

總結

以上是生活随笔為你收集整理的Mozilla “Common Voice” 开源语音识别项目的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： JavaSE之ClassLoader
下一篇：中国大数据争夺战已进入前所未有的高度