一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!...
人臉、車輛、人體屬性、卡證、交通標識等經典圖像識別能力,在我們當前數字化工作及生活中發揮著極其重要的作用。業內也不乏頂尖公司提供的可直接調用的API、SDK,但這些往往面臨著定制化場景泛化效果不好、價格昂貴、黑盒可控性低、技術壁壘難以形成多諸多痛點。
而今天小編要給大家推薦的是一個完全開源免費的、覆蓋人、車、OCR等9大經典識別場景、在CPU上可3毫秒實現急速識別、一行代碼就可實現迭代訓練的項目!
圖1 PaddleClas圖像分類應用示意圖
話不多說,趕緊送上傳送門,識貨的小伙伴趕緊嘗試一下吧!
https://github.com/PaddlePaddle/PaddleClas
記得Star收藏防止走丟哦!
當然,小編不是只管吆喝的,下面小編就來詳細拆解下這個項目的過人之處吧!
圖2 9大場景模型效果示意圖
亮點一:完美平衡精度與速度
從大名鼎鼎的Resnet50到如今火熱的Swin-Transformer,模型精度不斷被刷新,但是預測效率并不高。即使是Swin-Transformer最小的模型,在CPU上的預測速度也超過100ms,遠遠無法滿足產業實時預測的需求。
而使用MobileNet系列等輕量化模型可以保證較高的預測效率,在CPU上預測一張圖像大約3ms,但是模型精度往往和大模型有很大差距。
而PaddleClas推出的超輕量圖像分類方案(Practical Ultra Light Classification,簡稱PULC),就完美解決上述產業落地中算法精度和速度難以平衡的痛點。
表1 不同模型精度速度結果對比
如圖所示,它的精度與Swin-Transformer等大模型比肩,預測速度卻可以快30倍以上,在CPU上的推理時長僅需2ms!
亮點二:易用性極強
PULC方案不僅完美的平衡了精度與速度,還充分考慮了產業實踐過程中需要定制化的對算法快速迭代的需求,只需一行命令,就可完成模型訓練。
與此同時,PaddleClas 團隊還發布了包括人、車、OCR在內的9大場景模型,僅需2步就能實現業務 POC 效果驗證,訓練、推理、部署一條龍,真正實現“開箱即用”。
不僅如此,項目還匹配了詳細的中文使用文檔及產業實踐范例教程。
圖3 使用文檔及范例示意圖
亮點三:集成超多硬核技術
超輕量圖像分類方案(PULC)集成了業界4大業界領先的優化策略:
圖4 超輕量圖像分類方案(PULC)示意圖
PP-LCNet輕量級骨干網絡
PP-LCNet作為針對CPU量身打造的骨干網絡模型,在速度、精度方面均遠超如MobileNetV3等同體量算法,多個場景模型優化后,速度較SwinTransformer的模型快30倍以上,精度較MobileNetV3_small_0.35x高18個點。
SSLD預訓練權重
SSLD半監督蒸餾算法可以使小模型學習到大模型的特征和ImageNet22k無標簽大規模數據的知識。在訓練小模型時,使用SSLD預訓練權重作為模型的初始化參數,可以使不同場景的應用分類模型獲得1-2.5個點的精度提升。
數據增強策略集成
該方案融合了圖像變換、圖像裁剪和圖像混疊3種數據增強方法,并支持自定義調整觸發概率,能使模型的泛化能力大大增強,提升模型在實際場景中的性能。模型可以在上一步的基礎上,精度再提升1個點左右。
SKL-UGI知識蒸餾算法
SKL(symmetric-KL)在經典的KL知識蒸餾算法的基礎上引入對稱信息,提升了算法的魯棒性。同時,該方案可以方便的在訓練中加入無標簽訓練數據(Unlabeled General Image),可以進一步提升模型效果。該算法可以使模型精度繼續提升1-2個點。
加入PaddleClas技術交流群
入群福利:
1.獲取PaddleClas詳解本次升級內容的直播課鏈接。
2.獲取PaddleClas團隊整理的10G重磅圖像分類學習大禮包,包括:
圖5 PaddleClas入群禮包內容示意
入群方式:
SETP1:微信掃描二維碼,填寫問卷
SETP2:加入交流群領取福利
PaddleClas產業落地工具集
不僅如此,PaddleClas團隊考慮到真實產業應用面對的各種軟硬件環境和不同的場景需求,在提供PULC方案的同時,還提供了包括3種訓練方式、5種訓練環境、3種模型壓縮策略和9種推理部署方式在內的20種產業算法落地方案:
表3 圖像分類產業落地工具集訓練推理部署功能支持列表
集中值得高度關注的有:
01
分布式訓練
飛槳分布式訓練架構具備4D混合并行、端到端自適應分布式訓練等多項特色技術。在PP-LCNet訓練中,4機8卡相較于單機8卡加速比達到3.48倍,加速效率87%,精度無損。
02
模型壓縮
飛槳模型壓縮工具PaddleSlim功能完備,覆蓋模型裁剪、量化、蒸餾和NAS。圖像分類模型經過量化裁剪后,移動端平均預測耗時減少24%。
03
移動端/邊緣端部署
飛槳輕量化推理引擎Paddle Lite適配了20+ AI 加速芯片,可以快速實現圖像分類模型在移動設備、嵌入式設備和IOT設備等高效設備的部署。
以上所有模型、代碼均在PaddleClas中開源提供,還有超詳細文檔教程和范例項目,趕緊查看全部開源代碼并Star收藏吧~
鏈接指路:https://github.com/PaddlePaddle/PaddleClas
福利時間到
為了讓開發者們更深入的了解PaddleClas這次?發布的全新內容,解決落地應用難點,掌握產業實踐的核心能力,6月15-6月17日晚20:30飛槳團隊精心準備了為期三天的直播課程!
百度資深工程師將為我們詳細介紹超輕量圖像分類方案,對各場景模型優化原理及使用方式進行拆解,之后還有產業案例全流程實操,對各類痛難點解決方案進行手把手教學,加上直播現場互動答疑,還在等什么!抓緊掃碼上車吧!
更多閱讀
官網地址:https://www.paddlepaddle.org.cn
PaddleClas項目地址:
GitHub: https://github.com/PaddlePaddle/PaddleClas
Gitee: https://gitee.com/paddlepaddle/PaddleClas
總結
以上是生活随笔為你收集整理的一行代码完成模型训练,30倍加速,3毫秒急速识别,超强图像分类算法开源!...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 两万字的CAPL语法基础,一篇文章带你入
- 下一篇: linux下面如何看抓包文件,linux