excel图片地址直接显示图_图片转表格基于百度AI
? ?失蹤日久,皆因進(jìn)來學(xué)業(yè)繁重,其實(shí)就是沒好好學(xué)習(xí)。偶遇一有趣需求,方才始更一篇。
????需求如下:圖片內(nèi)表格,需直接將圖片轉(zhuǎn)換為excel表格。
????初步構(gòu)想,迅捷在線轉(zhuǎn)換,奈何沒找到直接轉(zhuǎn)換,圖片轉(zhuǎn)pdf再轉(zhuǎn)為excel又過于繁瑣,結(jié)合當(dāng)下opencv及百度AI的學(xué)習(xí)更番如下:
????首先想到使用opencv庫(Laplace算子)進(jìn)行圖像銳化,此處說明由于多數(shù)圖像為白紙黑字所以銳化是十分有必要的,識(shí)別文字邊框,進(jìn)而進(jìn)行圖片中文字識(shí)別。但因受限于網(wǎng)絡(luò)圖片清晰度及受限于本身PC的算力等原因造成識(shí)別結(jié)果差異化嚴(yán)重所以最終放棄。(但是后期會(huì)補(bǔ)上代碼)此次識(shí)別過程結(jié)果如下,不理想。
????進(jìn)而開始另求它法,因?yàn)樽罱趯W(xué)習(xí)計(jì)算機(jī)視覺相關(guān)內(nèi)容,所以各大AI平臺(tái)的公開接口是繞不開的。本次使用的百度AI大腦開放的ocr接口,識(shí)別精度肯定比個(gè)人PC的強(qiáng),畢竟算力的差距在那。插一句,我個(gè)人是一直認(rèn)為百度的技術(shù)積累是BAT三家里面最好的,也是最值得期待的。
????本次使用的百度開放給公共用戶的通用文字識(shí)別接口,為求精度本次使用的是高精度版本:https://ai.baidu.com/tech/ocr/general
????高精度版本在通用文字識(shí)別(標(biāo)準(zhǔn)版)的基礎(chǔ)上,提供更高精度的識(shí)別服務(wù),支持更多語種識(shí)別(丹麥語、荷蘭語、馬來語、瑞典語、印尼語、波蘭語、羅馬尼亞語、土耳其語、希臘語、匈牙利語),并將字庫從1w+擴(kuò)展到2w+,能識(shí)別所有常用字和大部分生僻字。
????開發(fā)語言選取python,也是最近一直在學(xué),沒辦法,學(xué)人工智障繞不開的。
在準(zhǔn)備開發(fā)之前首先確保你已經(jīng)完成了百度AI平臺(tái)的注冊,申請到了orc識(shí)別的接口,一般申請都會(huì)過的,萬一你沒過,反思一下最近是不是在哪撿錢了。
????接口請求方式采用post
????post和get這兩種請求方式各位在面向?qū)ο蟪绦蛟O(shè)計(jì)應(yīng)該都學(xué)過,當(dāng)然這里不確保你有對象哈!
????請求URL:https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic重點(diǎn)圈起來,這個(gè)請求的地址是統(tǒng)一的。
????然后你需要獲取到個(gè)人接口的access_token,這里的access_token類似于你微信的ID,確保你調(diào)用接口返回參數(shù)的唯一性。
百度AI的開發(fā)文檔給出了多種獲取access_token的方式,我最建議的還是內(nèi)嵌到你的程序中去。
????返回參數(shù)提供了json/excel兩種可選(哈哈哈哈哈哈哈哈,難道百度知道我要轉(zhuǎn)excel),選擇request_type類型為:excel,然后循環(huán)寫入excel文檔。因未能識(shí)別框線所以還是需要手動(dòng)注線,后期筆者努力盡快解決。識(shí)別結(jié)果:
注:注意開發(fā)過程中的個(gè)人sessionid和key的正確性,轉(zhuǎn)換結(jié)果文檔默認(rèn)保存到了當(dāng)前工程目錄下!
近期會(huì)持續(xù)更新一些考研相關(guān)的注意事項(xiàng),以及opencv的相關(guān)內(nèi)容和關(guān)于ocr識(shí)別的案例。
本次工程git鏈接:https://github.com/sevnxiaolu/PTT.git
感謝star!
最后希望各位最后10天好好復(fù)習(xí),上岸成功!
總結(jié)
以上是生活随笔為你收集整理的excel图片地址直接显示图_图片转表格基于百度AI的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎样对流媒体进行压力测试_暖气片怎样安装
- 下一篇: eeprom的wp 引脚_EEPROM