【论文解读】YOLOX: Exceeding YOLO Series in 2021
導讀
曠視團隊對YOLO系列的再一次超越。
論文鏈接:https://arxiv.org/abs/2107.08430
1. YOLOX
1.1 YOLOX-DarkNet53
YOLOv3 baseline ?以Darknet53作為Baseline,給大家介紹如何一步一步過渡到現在的YOLOX-DarkNet53。YOLOv3是以Darknet53為主干,后面再加上SPP。我們對訓練策略進行了一些修改,增加了EMA weights updating,余弦學習率,IoU損失,以及IoU-aware分支,在訓練分類和objectness的分支中,我們使用了BCE loss。在數據增強方面,我們只使用了水平翻轉,顏色抖動和多尺度。
Decoupled head ?在目標檢測中,分類和回歸的任務是有相互沖突的,這是個普遍認可的問題。因此,一般會將分類和回歸分開2個分支,但是在YOLO系列中,仍然是沒有分開的。這里,我們將耦合的檢測頭分開,變為2個相互獨立的檢測分支。具體如下圖:
Strong data augmentation ?在數據增強中,我們使用了Mosaic和Mix up的增強策略,使用了這些增強策略之后,我發現預訓練模型已經沒有必要了,因此后面所有的訓練都是從頭訓練的。
Anchor-free ?將YOLO轉換為anchor free其實很簡單,我們將每個空間位置的輸出由3減少到1,直接輸出4個值,即左上角點的兩個偏差值,以及寬和高。對于每個目標,其中心點位置所在的區域即為正樣本,并預先定義一個尺度范圍,將每個目標分配到不同的FPN層上。
Multi positives ?上面提到的anchor free的正樣本選擇策略,對于每個目標只選擇了1個正樣本,這樣會忽略掉其他的高質量的預測,使用這些高質量的預測對于梯度是有好處的,而且樣本的不均衡性也會減少一些。這里,我們簡單的使用了中心點3x3的區域,都作為正樣本。
SimOTA 對于標簽的分配,我們總結了4個關鍵點:1)損失/質量相關性 2)中心優先 3)每個GT的正樣本anchor點的動態數量 4)全局視角。我們使用OTA作為候選的標簽匹配策略。然后對OTA進行了修改,提出了SimOTA。首先,計算每個prediction-gt對的匹配度,用損失和質量來表示,這里,在SimOTA中,使用損失來表示:
其中,λ是平衡系數,然后,對于一個gt,用gi來表示,我們選擇在一個固定的中心區域內,topk個具有最小的cost的預測來作為正樣本,最后,這些正樣本所在的grid也被分配為正樣本,其他的grid是負樣本,注意,對于不同的gt,k是不一樣的。
End-to-end YOLO ?我們增加了2個額外的卷積層,進行一對一的標簽分配,不需要梯度。這使得檢測器可以端到端的運行,這個略微降低了性能和速度。所以作為可選項。
具體的各種修改的效果如下:
1.2 其他的backbone
我們還測試了其他的主干。
Modified CSPNet in YOLOv5
Tiny and Nano detectors
Model size and data augmentation
2. 和其他的SOTA的對比
—END—
論文鏈接:https://arxiv.org/abs/2107.08430
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯溫州大學《機器學習課程》視頻 本站qq群851320808,加入微信群請掃碼:總結
以上是生活随笔為你收集整理的【论文解读】YOLOX: Exceeding YOLO Series in 2021的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我的《机器学习》课程的课件合集下载
- 下一篇: 腾讯视频手机app下载安装_腾讯视频怎么