PaddleOCR二次全流程——1. 确定字体
1. 數(shù)據(jù)(待識(shí)別內(nèi)容)
要識(shí)別的內(nèi)容是這樣的,大致模式是:機(jī)器拍攝,然后識(shí)別屏幕上的表格文字。
2. 字體
確定字體的網(wǎng)站:
- 中文:識(shí)字體
- 英文:WhatTheFont
- 英文:FONT IDENTIFIER
不過以上字體基本都需要自己在網(wǎng)站做一些操作,框字體區(qū)域,然后會(huì)填寫當(dāng)前框?qū)?yīng)的正確字符,再去進(jìn)行識(shí)別。(但是對(duì)英文來說,往往在切分字符的時(shí)候就錯(cuò)了,所以這里就不再去尋找字體了)
這里選擇了幾種和上述比較像的字體來進(jìn)行替代,通過在windows默認(rèn)的console里切換字體,大致可以確定這種字體是TrueType字體
2.1 第一個(gè)圖的字體
暫定的字體:
2.1 第二個(gè)圖的字體
2.3 尋找字體文件
由于直接是在Adobe Acrobat里切換字體的,所以直接去軟件里找就好了,除了軟件里帶的,還有就是系統(tǒng)字體。
軟件自帶字體
參考:Adobe用戶指南-PDF 字體
在windows電腦上搜索以下路徑:
- C:\Program Files (x86)\Common Files\Adobe\Fonts
- Acrobat 文件夾中的 /Resource/Font
- /Program Files/Common Files/Adobe/Fonts
- C:\Program Files (x86)\Adobe\Acrobat DC\Resource\Font(最后我是在這個(gè)文件夾里找到的,不過這個(gè)文件夾里都是.otf字體,opentype類型)
系統(tǒng)字體
位置:
- C:\Windows\Fonts(建議調(diào)節(jié)成詳細(xì)信息顯示視圖,看起來會(huì)方便些)
2.4 整理字體文件
當(dāng)從系統(tǒng)字體復(fù)制的時(shí)候,可以看到,顯示的是一個(gè),但是實(shí)際上有四個(gè),使用的時(shí)候一般只需要常規(guī)字體,所以其他幾個(gè)加粗/斜體可以考慮刪除了。(按需取用)
最后可以找到的字體是:
consola.ttf
Deng.ttf
MSGothic.ttc
SegoeUI.ttf
YuGothR.ttc
其實(shí)全都是系統(tǒng)字體,并沒有使用到Adobe Acrobat的字體
總結(jié)
以上是生活随笔為你收集整理的PaddleOCR二次全流程——1. 确定字体的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 油猴脚本大全
- 下一篇: 国际通用计算机编码,计算机中的编码知识