【论文跟进】PP-YOLOE结构解析
原文地址:https://arxiv.org/abs/2203.16250
Github地址:https://github.com/PaddlePaddle/PaddleDetection
??上周剛剛學習繪制了YOLOX結構,這周發(fā)現PP-YOLOE新鮮出爐,特此記錄。
1.文章摘要
??本報告中,我們介紹了PP-YOLOE,這是一種具有高性能和友好部署的工業(yè)級先進目標檢測器。我們在之前的PP-YOLOv2的基礎上進行了優(yōu)化,使用anchor-free范式,更強大的backbone和neck,配備了CSPRepResStage、ET-head和動態(tài)標簽分配算法TAL。我們?yōu)椴煌膶嵺`場景提供了s/m/l/x模型。在COCO testdev上,PP-YOLOE-l的mAP為51.4,使用Tesla V100具有78.1 FPS,與之前最先進的工業(yè)模型PP-YOLOv2和YOLOX相比,分別獲得了(+1.9 AP,+13.35%提速)和(+1.3 AP,+24.96%提速)的顯著提高。此外,在TensorRT和FP16-precision的支持下,PP-YOLOE推理速度達到了149.2 FPS。我們還進行了大量的實驗來驗證我們設計的有效性。
2.為什么會有PP-YOLOE
??百度在2021年4月提出了PP-YOLOv2(原文鏈接:https://arxiv.org/abs/2104.10419 ),性能超越同等參數的YOLOv4-CSP和YOLOv5-l,而隨后7月份曠視科技的YOLOX一領風騷,這還能忍,必須走在YOLO系列的前端。受到YOLOX的啟發(fā),百度團隊優(yōu)化了PP-YOLOv2,順手提出了PP-YOLOE。
??PP-YOLOv2的總體情況包括:
??(1)backbone:具有可變形卷積的ResNet50-vd;
??(2)neck:具有SPP層的PAN,DropBlock;
??(3)head:輕量級的IoU感知;
??(4)激活函數:在backbone中使用ReLU激活,neck中使用Mish激活;
??(5)標簽分配:為每個ground truth目標分配一個anchor box;
??(6)損失:分類損失、回歸損失、目標損失,IoU損失和IoU感知損失;
??COCO性能對比:
????PP-YOLOv2:49.1 mAP,68.9 FPS(Tesla V100)
????YOLOX:50.1 mAP,68.9 FPS(Tesla V100)
????PP-YOLOE-l:51.4mAP,78.1 FPS(Tesla V100)
3.PP-YOLOE的改進
(1)Anchor-free
??Anchor-free方式最先在YOLOv1中出現,由于直接預測位置不準確,在后面的 YOLOv2、v3、v4和v5中均采用了Anchor方式。YOLOX中認為按聚類方式確定最優(yōu)Anchor尺寸局限于特定領域,難以推廣,此外還增加了head的復雜度與每張圖像的預測數量,故采用了Anchor-free方式。
??同樣,PP-YOLOE中亦采用Anchor-free方式。作者實驗說采用Anchor-free方式加快了模型速度,但是精度相比于基線PP-YOLOv2降低了0.3mAP。
(2)RepResBlock
??啟發(fā)于TreeBlock(原文鏈接:https://arxiv.org/abs/2109.12342 ),提出了一種新穎的RepResBlock,將殘差連接和密集連接結合起來,用于backbone和neck中。RepResBlock可提升精度0.7mAP。
??原TreeBlock如下,唔…有點復雜,不過RepResBlock對其進行了簡化。
(3)Task Alignment Learning (TAL)
??標簽分配策略是目標檢測中的一個重要過程,YOLOX采用SimOTA分配策略。TAL由動態(tài)標簽分配與任務對齊損失組成。動態(tài)標簽分配意味著預測感知,根據預測,為每個ground truth目標分配動態(tài)的正樣本。通過顯式對齊兩個任務,TAL可以同時獲得最高的分類準確率和最精確的邊界框。TAL可提升精度0.9mAP。
(4)Efficient Task-aligned Head (ET-head)
??為了解決分類任務與定位任務沖突的問題,YOLOX中采用了Decoupled head結構。但作者認為Decoupled head結構會使分類和定位任務分離獨立,缺乏任務特異性學習,故提出了ET-head,ET-head可提升精度0.5mAP。
??對于分類和定位任務的學習,作者分別選擇了變焦損失(VFL)和分布焦損失(DFL)。VFL使用target score對陽性樣本的損失進行加權,使得具有高IoU的陽性樣本對損失的貢獻相對更大,也使得模型在訓練時更加關注高質量的樣本而不是低質量的樣本。DFL是為了解決邊界框表示不靈活的問題,提出了利用常規(guī)分布預測邊界框的方法。
??模型損失函數為:
總結
以上是生活随笔為你收集整理的【论文跟进】PP-YOLOE结构解析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年G2电站锅炉司炉最新解析及G2
- 下一篇: AI与大数据结合,有效提高预测,构建更好