【论文阅读】【3d目标检测】Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
論文標題:Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
AAAI2022 南加大
這篇文章的主題思想是認為現在的基于點云的目標檢測方法實際上都是2.5D的方法而非3d的方法:原因是3d點云雖然具有3d的信息,但是點云檢測到的物體往往是存在遮擋問題的。
作者將物體上的點云遮擋情況劃分為三個部分:
外部遮擋:即目標前有遮擋物,如下圖?所示。激光打到遮擋物后返回,導致目標形狀缺失,?中紅色區域即缺失區域。
信號缺失:由于某些材料或者反射角度等問題,激光打到目標時,不會返回,造成信號缺失,如下圖?中藍色區域。
自我遮擋:即目標前面遮擋后面。由于激光不能穿透,激光打到目標前面區域后就會返回,導致目標后面區域信息缺失,如下圖(d)中綠色區域所示。
作者將它們依次補全,發現得到了ap上的提升!
于是作者決定提出一個網絡,來探究那些被遮擋住的點!
對于基準框中目標形狀的近似
遮擋和信號缺失的問題使得我們不能獲得關于基準框中目標的完整的形狀信息。因此作者利用如下兩個假設來近似目標的完整形狀信息,兩個假設分別是:
大多數前景對象類似于數量有限的形狀原型,例如行人有幾種固定的體型。
前景對象,特別是車輛和騎自行車者,大致對稱。
基于這兩個假設,作者先補全目標的點云。
具體做法是利用目標框,找到屬于目標的點云,利用標注框鏡像所有的點云。
作者在原文中講利用source point來補全target的,具體做法是:
有點奇怪,作者實際上是做了n個source 來進行補全?
這樣的話是不是好麻煩。而且從后面的操作來看的話也不是很有必要:
隨后作者用均勻球面進行點云的體素化。由球面編碼作者得出被遮擋的區域:
隨后作者把補充后的點云投影到體素中,非空體素則進行label為occupancy 的區域,其他的為0.
由此我們便一次為監督作為訓練。
有個問題是,既然我們前面已經用了gt來進行點云的補充,那為什么不省略這一步點云補充,直接用bbox粗略地來進行occupancy區域的label呢?這樣的效果不是更好嗎。
隨后作者便用一個網絡來檢測占據率,
將占據率投影到rpn的各層feature中,進行feature拼接,隨后進行roi pooling,得到優化的bbox。
關注這篇文章主要是該文章對于單車行人有很好的檢測效果,但是感覺創新點還是一般。
總結
以上是生活随笔為你收集整理的【论文阅读】【3d目标检测】Behind the Curtain: Learning Occluded Shapes for 3D Object Detection的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 王者荣耀服务器什么时候增加人数,王者荣耀
- 下一篇: 中国百家姓氏图腾大全