高精度PP-YOLOE
目標檢測作為計算機視覺領域的頂梁柱,不僅可以獨立完成車輛、商品、缺陷檢測等任務,也是人臉識別、視頻分析、以圖搜圖等復合技術的核心模塊,在自動駕駛、工業視覺、安防交通等領域的商業價值有目共睹。
正因如此,YOLOv5、YOLOX、PP-YOLOE、PP-PicoDet等優秀算法層出不窮,各有優劣側重。而在當前云、邊、端多場景協同的產業大趨勢下,運行速度、模型計算量、模型格式轉化、硬件適配、統一部署方案等實際問題都需要考慮,到底該怎么選呢?
今天小編就給大家推薦一個,針對云、邊、端各環境都深層優化的超強目標檢測開發套件——PaddleDetection。無論你追求的是高精度、輕量化,還是場景預訓練模型,它其中的模型都能以業界高標準滿足你的需求。同時,這些模型都擁有統一的使用方式及部署策略,不再需要進行模型轉化、接口調整,更貼合工業大生產標準化、模塊化的需求!
還在等什么!趕緊查看全部開源代碼并Star收藏吧!!
下面,讓我們來詳細解讀下這個開發套件中的模型,是如何達到業界高標準,又如何提供產業極佳實踐體驗的!
PP-YOLOE:
高精度SOTA目標檢測模型
PP-YOLOE根據不同應用場景設計了s/m/l/x,4個尺寸的模型來支持不同算力水平的硬件,無論是哪個尺寸,精度-速度的平衡都超越當前所有同等計算量下的YOLO模型!
- 性能卓越:具體來說,PP-YOLOE-l在COCO test-dev上以精度51.4%,TRT FP16推理速度149FPS的優異數據,相較YOLOX,精度提升1.3%,加速25%;相較YOLOv5,精度提升0.7%,加速26.8%。訓練速度較PP-YOLOv2提高33%,降低模型訓練成本。
- 部署友好:與此同時,PP-YOLOE在結構設計上避免使用如deformable convolution或者matrix nms之類的特殊算子,使其能輕松適配更多硬件。當前已經完備支持NVIDIA V100、T4這樣的云端GPU架構以及如Jetson系列等邊緣端GPU和FPGA開發板。
PP-PicoDet:
0.7M超超輕量SOTA目標檢測模型
超乎想象的超小體積及超預期的性能,使PP-PicoDet成為邊緣、低功耗硬件部署的極佳選擇,而此次發布更是在原有基礎上再次升級:
- 更強性能:PP-PicoDet-S參數量僅有1.18M,卻有32.5%mAP的精度,相較YOLOX-Nano高6.7%,推理速度提升了26%;相較NanoDet-Plus,mAP也高出了2%,速度提升30%。最新增加的PP-PicoDet-XS更是僅有0.7M,在CPU上預測速度可達250FPS以上,在訓練速度上也大幅提升一倍以上。
- 更好優化支持:考慮到端側對計算量的優化追求是極致的,PP-PicoDet在模型量化訓練和稀疏化壓縮方案支持方面做了更深度的打磨,僅需兩步,即可實現在移動端部署加速30%以上的效果。
- 更友好部署:為了部署更加輕松高效, PP-PicoDet在模型導出環節,將模型的后處理包含在了網絡中,支持預測直接輸出檢測結果,無需額外開發后處理模塊,還能端到端加速10%-20%。
更多開源社區優秀算法
統一、極致的開發體驗
PaddleDetection還第一時間收錄了如YOLOv4、YOLOX及SwinTransformer等在內的前沿優秀算法,與Faster-RCNN、YOLOv3等經典算法一同,為用戶提供極致簡單、統一的使用方式,且得益于飛槳原生推理庫Paddle Inference及飛槳端側推理框架Paddle Lite的能力,通過支持TensorRT和OpenVino,開發者可以快速完成在服務端和邊緣端GPU或ARM CPU、NPU等硬件上的高性能加速部署。此外,PaddleDetection還支持一鍵導出為ONNX格式,順暢對接ONNX生態。
以上所有模型、代碼及使用文檔、Demo均在PaddleDetection中開源提供,從此無需再內卷,通用目標檢測,這一個項目就夠了!
總結
以上是生活随笔為你收集整理的高精度PP-YOLOE的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【转载】好电影!保存了,没事干的时…
- 下一篇: 林之间的信任关系