Java语音转文字功能
生活随笔
收集整理的這篇文章主要介紹了
Java语音转文字功能
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
語音轉文字
- 百度智能云
- JAVA代碼實現
考慮到在識別mp3文件是否有聲音之后,后續會做語音轉文字這些功能
就提前去搜索了一下,貌似基本只能靠第三方來實現
百度智能云
1.創建一個百度/百度智能云用戶,有的直接登錄就行
2.進入右上角管理控制臺
3.產品服務里面找到語音技術4.
里面有多重方式
因為這里限制了語音時長,所以就不考慮,如果符合要求可以考慮這個
繼續找
這里就滿足需求了
去下載demo,然后創建應用 ,提前領取免費的接口額度,雖然時間不長,足夠測試用了
創建好之后會有個應用列表,里面有appID ,APIkey, Secret Key ,之后都會用到
JAVA代碼實現
因為我是springboot項目,所以在pom.xml里面引入了依賴包
<dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.2.1</version></dependency><!-- 引入org.json所需依賴 --><dependency><groupId>org.json</groupId><artifactId>json</artifactId><version>20190722</version></dependency>然后把demo里面的代碼拷貝過來
修改Const 里面的配置信息 ,這里就用到了自己應用管理里面給你分配的
public interface Const {/* 下面2個是鑒權信息 ,具體參數在sendStartFrame() 方法內 */int APPID = APPID ;String APPKEY = "APPKEY ";/* dev_pid 是語言模型 , 可以修改為其它語言模型測試,如遠場普通話 19362*/int DEV_PID = 15372;/* 可以改為wss:// */String URI = "ws://vop.baidu.com/realtime_asr"; }接著發現文檔描述的只支持pcm格式的音頻文件
還好我提前去了解了一下sound包里面的audioInputStream
這里可以參考我上一篇寫的
Java判斷mp3文件是否有聲音
使用inputStream 的子類audioInputStream 然后再配置format
測試:
這里測試成功,能成功讀取mp3里面內容
這里我用了工具Audacity把pcm文件轉成mp3文件
不知道會不會有影響
有空我再去測一下其他mp3文件
當然這個文檔也標明了嘈雜的環境等可能會對識別有影響
這篇文章應該是不完善的,只是提供一個思路
新手發帖,希望多多提一下寶貴的意見和建議,謝謝
總結
以上是生活随笔為你收集整理的Java语音转文字功能的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 4字节 经纬度_java 获取本机经纬度
- 下一篇: python保存模型_MNIST数据集训