5.16-在线词识别程序学习(ASR+IAT)
一些信息
6.bin文件夾是調(diào)試路徑,里面文件的作用如下:
? msc.dll是WIN32平臺程序必需的動態(tài)庫;
? msc_x64.dll是x64平臺程序必需的動態(tài)庫;
? msc.cfg包含了配置信息,調(diào)試、測試時不需改動,發(fā)布產(chǎn)品后可以將倒數(shù)第五行的“output=1”改為“output=0”,“output=1”時會輸出運行日志到msc.log,在調(diào)試時出現(xiàn)問題可以發(fā)給我們幫助你分析,“output=0”時會關(guān)閉日志輸出,為用戶節(jié)省磁盤空間;
? asr_keywords_utf8.txt是asrdemo中用到的命令詞列表,編碼為UTF8,對其內(nèi)容進行修改時,請不要用系統(tǒng)自帶的記事本程序,建議使用Notepad++或UltraEdit等文本編輯軟件;
? gm_continuous_digit.abnf是asrdemo_with_abnf中用到的語法文件,編碼為GB2312,對其內(nèi)容進行修改時,請參照doc文件夾下的《語法開發(fā)指南》;
? wav文件夾里面都是事先準備好的錄音文件,分別用于asrdemo、asrdemo_with_abnf、iatdemo、iatdemo_with_multi-result;
? 當(dāng)運行過樣例程序之后,還會生成一個以md5值為名的文件夾,其中保存的文件內(nèi)容是程序運行中記錄的性能信息和錯誤信息,將會上傳到服務(wù)器,有利于我們改善服務(wù)質(zhì)量,請不要刪除。
7.新增iatdemo_with_user_vocabulary(上傳用戶詞表demo),關(guān)鍵詞上傳后,當(dāng)次會話沒有效果,云端需要一段時間對關(guān)鍵詞表進行激活,稍后才能正常使用。
iat(語音聽寫)和asr(語音識別)均可以上傳用戶詞列表,但目前不知道其區(qū)別。
ASR上傳命令詞程序?qū)W習(xí)
在TXT文件中添加關(guān)鍵詞,重新上傳獲得GID,只需上傳一次即可,記住ID,以便以后使用,若添加了新關(guān)鍵詞,則需重新上傳獲得ID
若列表中沒有這個詞語,則顯示結(jié)果與此類似:
The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca
對“喂你好我是一名大學(xué)生”添加不同種類關(guān)鍵詞的影響
添加整句話,識別率高,效率低
長傳新的詞表后"科大訊飛"被識別為"歌華有線",此表中兩個詞語同時存在,將"歌華有線"刪除,重新上傳,將"科大訊飛"識別為"葛洲壩",4,5均無法識別,不知道激活時間有多長
經(jīng)過一天等待,情況沒有改善,應(yīng)該仔細審讀程序,消除Grammar的問題。
調(diào)整壓縮比等上傳參數(shù),使得識別效果和消耗時間指標比較均衡
?
科大訊飛語音功能小結(jié)
科大訊飛的示例demo比較炕爹,它必須在你申請的appid基礎(chǔ)上運行,否則會出錯哦!也就是你必須申請appid,然后才能下載示例demo,很炕爹吧!
?
這里我就不多余重復(fù)開發(fā)文檔中的了,說一些自己的理解:
1.我之前有一個想法,就是科大訊飛在語音識別的時候,需要你上傳命令詞,詞表或者聯(lián)系人,我們可以在注冊開發(fā)者的時候在自己的信息中上傳自己的詞庫,然后我們在程序中只需要通過登錄來獲取一個標示token什么的,這樣的話,如果你的詞庫發(fā)生變化了,就不需要更改代碼了,只需要在自己的開發(fā)者信息下重新上傳一下,不用更改程序了,科大訊飛的技術(shù)支持的回復(fù)是web端沒有提供這個接口,他們的回復(fù)是:我們可以申請一個web端的appid,然后在自己的服務(wù)器上做這樣的處理
2. 詞表和聯(lián)系人在上傳的時候沒有返回grammerID,在語音識別的時候需要登錄,上傳一次;命令詞和abnf語法上傳也是上傳一次,但是這里會回復(fù)一個grammerID這樣就需要在語音識別的時候傳參。
3.命令詞和詞表的區(qū)別在于:
? ? ?命令詞:語音識別的時候會只在命令詞的范圍內(nèi)搜索
? ? ?詞表:語音識別優(yōu)先從詞表中搜索
4.在添加的框架中如果是在ios5系統(tǒng)下ADSupport.framework要設(shè)為optional
5.如果想要自定義UI則須參考無UI的demo,然后在- (void) onVolumeChanged: (int) volume;這個回調(diào)里面隨著語音的音量大小來切換圖片
6.grammerID可以跨平臺使用?
?
Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>
轉(zhuǎn)載于:https://www.cnblogs.com/lizhensheng/p/11241940.html
總結(jié)
以上是生活随笔為你收集整理的5.16-在线词识别程序学习(ASR+IAT)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: unigui中TUniDBEdit的On
- 下一篇: 出现“ORA-28000:the acc