【深度学习】——物体检测的难点
目錄
一、小物體檢測(cè)
1、降采樣率減小 +空洞卷積
2、anchor設(shè)計(jì)
1)統(tǒng)計(jì)方法
2)anchor邊框聚類
3、多尺度訓(xùn)練(multi scale training——MST)
4、 特征融合
一、小物體檢測(cè)
????????在分類任務(wù)中,一般物體的大小都差不多,這也使得單純的分類任務(wù)不需要考慮物體的大小等因素,但是在目標(biāo)檢測(cè)中,因?yàn)樵谕粋€(gè)圖像中,可能會(huì)出現(xiàn)多個(gè)目標(biāo),有的目標(biāo)像素占比大,有的目標(biāo)像素占比小,比如遠(yuǎn)處的人高度只有30個(gè)像素,近處的人卻有幾百個(gè)像素,這導(dǎo)致在深度學(xué)習(xí)的前向傳播過(guò)程中,由于下降樣的因素,會(huì)導(dǎo)致小目標(biāo)在降采樣的過(guò)程中直接丟失。
??????? 一般解決的方法有以下幾種:降采樣率減小、anchor設(shè)計(jì)、多尺寸訓(xùn)練、特征融合、尺度歸一化(SNIP)
1、降采樣率減小 +空洞卷積
?????? 將采樣率下降的話就可以使得更小的物體能夠保留下來(lái),而不至于在下采樣后一個(gè)像素點(diǎn)都不保留,但是減小下采樣率會(huì)導(dǎo)致模型的感受野減小,這樣對(duì)于模型是不利的,因此為了平衡二者之間的關(guān)系,一般我們可以使用空洞卷積來(lái)維持感受野的大小。
2、anchor設(shè)計(jì)
1)統(tǒng)計(jì)方法
????????設(shè)計(jì)多組anchor,然后將每一組anchor和真實(shí)框進(jìn)行對(duì)比,以IOU和正樣本數(shù)作為指標(biāo)。取一組性能指標(biāo)指示最好的anchor作為訓(xùn)練的anchor。
????????同一類物體雖然在單一尺寸上有很大的區(qū)別,但是在寬高比例上可能差別不大。
2)anchor邊框聚類
????????利用k-means等聚類算法對(duì)訓(xùn)練集的真實(shí)框的長(zhǎng)寬進(jìn)行聚類,得到k個(gè)中心,將這些中心的值作為anchor生成的比例。具體可以參考yolov3模型。
3、多尺度訓(xùn)練(multi scale training——MST)
??????? 訓(xùn)練的時(shí)候?qū)D像縮放成指定的尺度,然后進(jìn)行訓(xùn)練。為了實(shí)現(xiàn)多尺度,先設(shè)置多組不同的尺度,然后每次迭代訓(xùn)練的時(shí)候都是先隨機(jī)選取一個(gè)尺度,然后將輸入圖像縮放到這個(gè)尺度后再進(jìn)行訓(xùn)練,雖然在同一次的迭代時(shí),尺度是一樣的,但是不同的迭代會(huì)有不一樣的尺度,這樣得到的模型就會(huì)有較高的魯棒性。
??????? 測(cè)試的時(shí)候則將圖像放大4倍或者其他倍數(shù)后,再進(jìn)行檢測(cè),這樣有利于小物體的檢測(cè)。
4、 特征融合
??????? 一個(gè)圖像在深度學(xué)習(xí)模型前向傳播的過(guò)程中,圖像會(huì)逐漸減小,導(dǎo)致圖像的細(xì)節(jié)丟失,語(yǔ)義信息增加。即淺層的圖像細(xì)節(jié)多,深層的圖像語(yǔ)義信息多,因此可以將深層的上采樣回來(lái)和淺層的進(jìn)行融合。常見(jiàn)的有FPN、DetNet、彩虹融合、dssd等等
?5、
?
總結(jié)
以上是生活随笔為你收集整理的【深度学习】——物体检测的难点的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: golang 反射
- 下一篇: 1H413000工业机电工程安装技术——