DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation(笔记)
論文地址
一、主要內容介紹
1. 問題背景
對于高分辨率的圖像,如何在高推斷速度的情況下,保證推斷精度呢?
為了提高模型的學習能力,以及增大感受野,特征重利用(feature reuse) 是個不錯的方法。文章提出的網絡結構如圖Figure 2(d).通過子網絡聚合(sub-network aggregation)和子狀態聚合(sub-stage aggregation)來重利用特征。
2. 文章貢獻點
文章提出了一種深度信息整合網絡(DFANet)用于實時語義分割。
主要有三個貢獻點:
二、網絡結構
1. backbone
Figure 3中共有3個backbone,每個backbone都是改進版的Xception網絡。
2. 子網絡聚合——網絡級聯
圖中的紅色箭頭部分
處理過程:將上一個backbone 的輸出,作為下一個backbone的輸入。這個上一個backbone 的輸出上采樣四次后輸入下一個backbone。
3. 子狀態聚合
橙色箭頭部分。不同backbone的相應狀態聚合
對于第一個backbone,n=1n=1n=1,第iii個狀態xinx_{i}^{n}xin? 等于上一狀態的輸入和輸出的和,當n>1n>1n>1時,xinx_{i}^{n}xin? 等于上一狀態(i?1i-1i?1)以及上一個網絡(n?1n-1n?1)的當前狀態(iii)的級聯。iii – 狀態,nnn – backbone
4. decoder
融合底層和高層的特征,沒有使用中間層的特征。
三、實驗細節
3.損失函數:交叉熵損失
四、問題
當使用3個Backbone A時的mIoU比2個時小?2個Backbone A時的感受野已經比圖像大,在增加一個Backbone,會引入噪聲。
總結
以上是生活随笔為你收集整理的DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation(笔记)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: opencv基础
- 下一篇: 神经网络中的激活函数的比较