通用印刷体文字识别_腾讯云通用文字识别GeneralOCR-图片文字识别 印刷体文字识别...
產品介紹
通用文字識別(General Optical Character Recognition,General OCR)基于行業前沿的深度學習技術,提供通用印刷體識別、通用印刷體識別(高精度版)、通用手寫體識別、英文識別等多種服務,支持將圖片上的文字內容,智能識別為可編輯的文本,可應用于隨手拍掃描、紙質文檔電子化、電商廣告審核等多種場景,大幅提升信息處理效率。
產品功能
通用印刷體識別
支持多場景、任意版面下整圖文字的識別。支持自動識別語言類型,同時支持自選語言種類(推薦),除中英文外,支持日語、韓語、西班牙語、法語、德語、葡萄牙語、越南語、馬來語、俄語、意大利語、荷蘭語、瑞典語、芬蘭語、丹麥語、挪威語、匈牙利語、泰語等多種語言。應用場景包括:印刷文檔識別、網絡圖片識別、廣告圖文字識別、街景店招識別、菜單識別、視頻標題識別、頭像文字識別等。
通用印刷體識別(高精度版)
支持圖像整體文字的檢測和識別,返回文字框位置與文字內容。相比通用印刷體識別接口,準確率和召回率更高。
通用印刷體識別(精簡版)
支持多場景、任意版面下整圖文字的識別。相較于“通用印刷體識別”接口,精簡版接口在準召率有一定損失的情況下,耗時更短。適用于對接口耗時較為敏感的客戶。
通用印刷體識別(高速版)
支持圖像整體文字的檢測和識別,返回文字框位置與文字內容。暫未支持多語種識別,推薦使用通用印刷體識別接口。
通用手寫體識別
支持多場景、任意版面下整圖文字中的手寫中文、英文、字母、數字、常見字符的識別。針對手寫字體無規則、字跡潦草、模糊等特點進行了識別能力的增強。可應用于銀行、保險、金融等手寫單據錄入、教育行業筆記文檔化等場景。
英文識別
支持圖像英文文字的檢測和識別,返回文字框位置與文字內容。支持多場景、任意版面下的英文、字母、數字和常見字符的識別,同時覆蓋英文印刷體和英文手寫體識別。可應用于英文筆記作業文檔化、英文試卷答題卡識別等場景。
廣告文字識別
支持廣告商品圖片內文字的檢測和識別,返回文本框位置與文字內容。支持中英文、橫排和豎排文字識別,支持90度、180度、270度翻轉以及傾斜場景文字識別。文字識別的召回率和準確率能達到96%以上。
快速文本檢測
通過檢測圖片中的文字信息特征,快速判斷圖片中有無文字并返回判斷結果,幫助用戶過濾無文字的圖片。
產品優勢
能力全面
支持中英文、日文、韓文、西班牙文、法文、德文、葡萄牙文、阿拉伯數字及常用符號等的識別。并不斷更新迭代模型,擴充支持的廣度。
算法領先
支持圖片中文字的自動定位和識別,印刷體整體識別準確率達95%以上,手寫體達90%以上,保證99.5%以上產品可用性。
魯棒性強
支持多場景、任意版面、任意背景,可容忍透視畸變、光照不均等復雜場景,并可實現自動裁邊、修正傾斜等。
應用場景
紙質文檔電子化
使用通用文字識別技術,助您完成大量的文檔整理工作,從書籍、紙質論文、檔案、PPT 課件等印刷資料,到課堂筆記、作業作文等手寫內容,均可實現拍照自動識別文字,方便用戶進行文本錄入和文檔管理,提高產品易用性和用戶體驗。
內容審核與管理
識別圖像中的違規文字,如社交和電商等應用中的違規內容、宣傳物料中的廣告用語、視頻中的廣告、標題與字幕等垃圾文本,提示相應風險,協助用戶進行違規處理,幫助用戶有效規避業務風險。
隨手拍掃描
支持快速識別路標、指示牌、廣告牌、街邊店鋪招牌、商品包裝、購物小票等生活場景中的實體文字信息,應用于地圖、翻譯、搜索、生活出行等移動應用中,方便用戶進行文本的提取或錄入,有效提升產品易用性和用戶使用體驗。
總結
以上是生活随笔為你收集整理的通用印刷体文字识别_腾讯云通用文字识别GeneralOCR-图片文字识别 印刷体文字识别...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于2020年美赛F奖的经验贴
- 下一篇: 商业数据可视化分析工具