详解3D点云分割网络 Cylindrical and Asymmetrical 3D Convolution Networksfor LiDAR Segmentation
本文介紹一篇3D點云分割網絡:Cylinder3D,論文已收錄于 CVPR 2021。 這里重點是理解本文提出的 Cylindrical Partition 和 Asymmetrical 3D Convolution Network。
論文鏈接為:https://arxiv.org/pdf/2011.10033.pdf
項目鏈接為:https://github.com/xinge008/Cylinder3D
0. Abstract
本文提出了新的3D分割網絡:由圓柱坐標體素劃分和非對稱 3D 卷積網絡組成。此外本文還引入了一個 point-wise 模塊來改進體素塊輸出,提高辨識精度。
新的網絡在兩個大型室外場景數據集(SemanticKITTI 和 nuScenes)上進行了評估:在 SemanticKITTI 數據集上,新框架排名第一。在 nuScenes 數據集上,新方法的表現也大大超過了之前的方法。
1. Introduction & Related Work
引言部分作者介紹了點云分割的三種處理方式:投影為距離圖像,直方體分割、圓柱分割,從下圖可以看到,圓柱分割能夠有效提高分割精度。
研究現狀,作者介紹了 :
- 室內場景點云分割 :PointNet和聚類算法,不過室內場景點云數量比較少而且距離范圍很小,很難適用于室外場景;
- 室外場景點云分割:將3D投影為2D將不可避免失去3D幾何信息;
- 3D 體素分割 :將點云劃分為規則的體素,但是都忽視了點云的稀疏性和密度不均勻性;
2. Methodology (重點)
2.1 Framework Overview
網絡框架如下圖所示,由圓柱坐標體素劃分、非對稱3D卷積模塊、點元素模塊組成。
2.2 Cylindrical Partition
這里作者首先對比了直方體劃分和圓柱體劃分產生的非空網格比例情況,可以看到,距離越遠時,圓柱體劃分能產生更高比例的非空網格。
具體劃分流程如右圖所示,將直角坐標(x,y,z)(x,y,z)(x,y,z)轉換為圓柱體坐標(ρ,θ,z)( ρ,\theta,z)(ρ,θ,z),距離約遠時,劃分的網格就越大。同時使用MLP學習點云特征,最終得到的圓柱表示為 R∈C×H×W×L\mathbb{R} \in C \times H \times W \times LR∈C×H×W×L,這里CCC表示特征維度,HHH表示弧度,WWW表示角度,LLL表示高度。
2.3 Asymmetrical 3D Convolution Network
這里作者設計了非對稱3D卷積塊,如下圖所示,由下采樣和上采樣塊組成。
3. Experiments
首先對比了本文與其它分割算法在SemanticKITTI 和nuScenes數據集上的精度。
然后是對比實驗,驗證本文設計的各個模塊對分割精度的提升。
最后是擴展實驗,驗證本文設計的模塊對全景分割和物體檢測性能的提升。
總結
以上是生活随笔為你收集整理的详解3D点云分割网络 Cylindrical and Asymmetrical 3D Convolution Networksfor LiDAR Segmentation的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 动手学无人驾驶(5):多传感器数据融合
- 下一篇: 2017最新建行信用卡排行榜 独家优惠大