Python 神工具包!翻译、文字识别、语音转文字统统搞定
今天給大家介紹一款 Python 制作的實用工具包,包含多種功能:
- 音頻轉文字
- 文字轉語音
- 截圖 OCR文字識別
- 復制翻譯
舉個例子,比如截圖 OCR 文字識別就有很多實用場景。
常會遇到有些 PDF 是掃描版的無法復制(豆丁網上的),有些網頁(極客時間)也限制了復制功能。這時候要復制,通常情況下只能手動去打,很浪費時間對吧。當然也可以使用一些 OCR 識別軟件,但要么付費要體積很大,不方便。
用這款工具就很容易解決,只要打開軟件,點擊截圖就會自動識別,自動在對話框里輸出識別后的文字,然后直接復制就行了,非常方便:
實操效果:
再比如中英文翻譯也是經常會用到的,通常情況的操作是打開百度翻譯網頁然后復制進去翻譯,也不方便。
使用這款工具很輕松就能處理,翻譯效果還不錯:
動圖效果:
語音識別也很常用了,比如一些看了一些網課視頻想做筆記,不想去手打的話。可以先把視頻中的語音抽出來,然后使用該工具直接轉換成文字。
這些功能是 Python 實現的,很強大對吧。做起來也不難,兩步就能實現。
第一步獲取 API 接口。這些功能都是調用百度 AI 的各種功能 API 接口獲得的,免費使用次數足夠多。
第二步,使用 python 的 pyqt5 GUI 框架制作出可視化界面,pyqt5 需要稍微學下,但也不難,有具體的需求了學起來也更有針對性。
下面簡單說下如何獲取 API 接口。
以語音識別接口為例,進入百度語音識別網站:
http://ai.baidu.com/tech/speech/asrpro
選擇創建對應的「文字轉語音」和「語音識別」應用,就會給你一串秘鑰,重點保存好:API key 和 Secret key.
然后把兩串字符復制到這款工具中,點擊保存,就可以使用語音轉文字功能了。
其他功能接口獲取方法也是同樣的,這里給出各功能網址:
截圖文字識別:
http://ai.baidu.com/tech/ocr/general
文字轉語音:
http://ai.baidu.com/tech/speech/tts
復制翻譯:
http://fanyi-api.baidu.com/api/trans/product/index
如果你想嘗試這款工具,但嫌麻煩不想獲取接口的話,我把我自己的提供給你。
總結
以上是生活随笔為你收集整理的Python 神工具包!翻译、文字识别、语音转文字统统搞定的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python D6 if分支结构
- 下一篇: 超详细 1小时学会Python输入和输出