當前位置：首頁 > 编程语言 > java >内容正文

java

Java语音转文字功能

發布時間：2023/12/10 java 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 Java语音转文字功能小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

語音轉文字

百度智能云
JAVA代碼實現

考慮到在識別mp3文件是否有聲音之后，后續會做語音轉文字這些功能
就提前去搜索了一下，貌似基本只能靠第三方來實現

百度智能云

1.創建一個百度/百度智能云用戶，有的直接登錄就行
2.進入右上角管理控制臺
3.產品服務里面找到語音技術4.
里面有多重方式

因為這里限制了語音時長，所以就不考慮，如果符合要求可以考慮這個

繼續找

這里就滿足需求了

去下載demo，然后創建應用，提前領取免費的接口額度，雖然時間不長，足夠測試用了

創建好之后會有個應用列表，里面有appID ,APIkey, Secret Key ,之后都會用到

JAVA代碼實現

因為我是springboot項目，所以在pom.xml里面引入了依賴包

<dependency><groupId>com.squareup.okhttp3</groupId><artifactId>okhttp</artifactId><version>4.2.1</version></dependency><dependency><groupId>org.json</groupId><artifactId>json</artifactId><version>20190722</version></dependency>

然后把demo里面的代碼拷貝過來

修改Const 里面的配置信息，這里就用到了自己應用管理里面給你分配的

public interface Const {/* 下面2個是鑒權信息 ,具體參數在sendStartFrame() 方法內 */int APPID = APPID ;String APPKEY = "APPKEY ";/* dev_pid 是語言模型，可以修改為其它語言模型測試，如遠場普通話 19362*/int DEV_PID = 15372;/* 可以改為wss:// */String URI = "ws://vop.baidu.com/realtime_asr"; }

接著發現文檔描述的只支持pcm格式的音頻文件
還好我提前去了解了一下sound包里面的audioInputStream
這里可以參考我上一篇寫的
Java判斷mp3文件是否有聲音

使用inputStream 的子類audioInputStream 然后再配置format

測試：

這里測試成功，能成功讀取mp3里面內容

這里我用了工具Audacity把pcm文件轉成mp3文件
不知道會不會有影響
有空我再去測一下其他mp3文件
當然這個文檔也標明了嘈雜的環境等可能會對識別有影響
這篇文章應該是不完善的，只是提供一個思路
新手發帖，希望多多提一下寶貴的意見和建議，謝謝

總結

以上是生活随笔為你收集整理的Java语音转文字功能的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 4字节经纬度_java 获取本机经纬度
下一篇： python保存模型_MNIST数据集训