深度学习LiDAR定位:L3-Net
深度學(xué)習(xí)LiDAR定位:L3-Net
摘要
本文提出L3-Net——一種新穎的基于學(xué)習(xí)的LiDAR定位系統(tǒng),可實(shí)現(xiàn)厘米級(jí)的定位,與現(xiàn)有最高水平的傳統(tǒng)定位算法相媲美。與傳統(tǒng)定位算法不同,本文創(chuàng)新地實(shí)現(xiàn)了使用各種深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來建立基于學(xué)習(xí)的定位算法。首先,L3-Net會(huì)學(xué)習(xí)專門針對(duì)不同現(xiàn)實(shí)駕駛場(chǎng)景中的匹配而優(yōu)化的局部描述,在解決方案空間中建立的成本量上的3D卷積顯著提高了定位精度。其次,使用RNN對(duì)車輛動(dòng)力學(xué)進(jìn)行建模,從而獲得更好的時(shí)間平滑度和準(zhǔn)確性。然后,本文使用新收集的數(shù)據(jù)集全面驗(yàn)證了L3-Net的有效性。最后,本文使用了具有挑戰(zhàn)的SunnyvaleBigLoop序列(在采集的地圖和測(cè)試數(shù)據(jù)之間間隔了一年時(shí)間的序列)進(jìn)行測(cè)試,測(cè)試結(jié)果表明,L3-Net在這些數(shù)據(jù)集中具有很低的定位誤差,證明了其在實(shí)際工業(yè)實(shí)現(xiàn)中的成熟度。
背景及問題描述
傳統(tǒng)LiDAR定位算法流程與基于學(xué)習(xí)的定位算法流程對(duì)比如圖1所示。其中,傳統(tǒng)算法的步驟通常是:特征描述(如點(diǎn)、平面、桿、2D柵格上基于高度的高斯特征等)、地圖匹配、匹配誤差的計(jì)算、空間搜索或優(yōu)化(如全搜索或由粗到精的搜索,蒙特卡洛采樣或迭代梯度下降最小化)。這些傳統(tǒng)算法中,通常需要利用點(diǎn)云的幾何特征、反射強(qiáng)度特征來進(jìn)行配準(zhǔn)或?yàn)V波,實(shí)現(xiàn)定位。常見的有基于ICP、NDT、直方圖濾波、卡爾曼濾波等的定位算法。盡管其中一些算法具有不同場(chǎng)景下出色的準(zhǔn)確性和魯棒性,但通常需要大量的工程工作來調(diào)優(yōu)流程中的每個(gè)模塊,并設(shè)計(jì)硬編碼的特征和匹配方法。此外,這些傳統(tǒng)定位算法的系統(tǒng)類型對(duì)運(yùn)行場(chǎng)景有很強(qiáng)的偏好。要使一個(gè)通用的定位系統(tǒng)能夠適應(yīng)所有具有挑戰(zhàn)性的場(chǎng)景需要巨大的工程努力,這通常是極其困難的。
圖 1 傳統(tǒng)與基于學(xué)習(xí)的定位算法流程圖
而基于學(xué)習(xí)的方法以數(shù)據(jù)驅(qū)動(dòng)的方式為上述問題的解決開辟了一條全新的道路。
主要貢獻(xiàn)
(1)根據(jù)作者了解,這是當(dāng)時(shí)第一個(gè)基于學(xué)習(xí)的,用于自動(dòng)駕駛的LiDAR定位框架,可直接處理點(diǎn)云并準(zhǔn)確估計(jì)車輛的位置和方向,并能得到與當(dāng)時(shí)最好的算法相媲美的效果。
(2)創(chuàng)新性的使用3D卷積學(xué)習(xí)如何調(diào)整x,y,yaw這三個(gè)維度上的匹配代價(jià)以提高定位精度
(3)將提出的算法在同一條道路上在不同時(shí)間進(jìn)行了多次試驗(yàn),并在各種城市道路上進(jìn)行嚴(yán)格的測(cè)試;發(fā)布數(shù)據(jù)集,數(shù)據(jù)集包含超過380公里的真實(shí)交通駕駛場(chǎng)景的數(shù)據(jù),適合定位任務(wù)。
主要原理及思路
L3-Net主要由Keypoint Selection、Descriptor
Extraction、Cost Volume and 3D CNNs、Probability Offset Volume、以及Temporal
Smoothness五個(gè)部分組成。輸入為已構(gòu)建的點(diǎn)云地圖和行駛時(shí)的LiDAR觀測(cè)數(shù)據(jù)。接下來分五個(gè)部分分別描述L3-Net的細(xì)節(jié)。L3-Net網(wǎng)絡(luò)架構(gòu)如圖2所示:
圖2 L3-Net的架構(gòu)圖
1、Keypoint Selection
3-Net中關(guān)鍵點(diǎn)選擇方法是:
(1)選取鄰域內(nèi)滿足一定密度的點(diǎn)。
(2)估算鄰域內(nèi)的點(diǎn)的線性度和散度,挑出具有強(qiáng)線性和散度的點(diǎn)作為候選關(guān)鍵點(diǎn)。
(3)根據(jù)組合的幾何特性排序,并由高到低,選取最少數(shù)量的候選點(diǎn)作為關(guān)鍵點(diǎn),同時(shí)確保這些新選出來的點(diǎn)各自與其它點(diǎn)保持一定空間距離。
2、Descriptor Extraction
描述子提取的方法為:
(1)為每一個(gè)關(guān)鍵點(diǎn)選取鄰域內(nèi)64個(gè)點(diǎn),每個(gè)點(diǎn)包含x,y,z,r(reflection)四維數(shù)據(jù),故一個(gè)關(guān)鍵點(diǎn)描述子的提取輸入為64x4的張量。
(2)使用mini-PointNet對(duì)關(guān)鍵點(diǎn)特征進(jìn)行提取,輸出得到32維的描述子。
(3)使用參數(shù)共享機(jī)制為地圖和實(shí)時(shí)點(diǎn)云數(shù)據(jù)提取特征。其中,mini-PointNet主要包含由3個(gè)堆疊的全連接層和一個(gè)最大池化層組成的多層感知機(jī)(MLP)。
3、Cost Volume and 3D CNNs
3.1、Cost Volume
匹配代價(jià)描述的是實(shí)時(shí)點(diǎn)云幀與地圖之間的匹配誤差。對(duì)于某一個(gè)關(guān)鍵點(diǎn),計(jì)算匹配代價(jià)的方法為:
(1)給定一個(gè)預(yù)測(cè)的位姿,將局部的實(shí)時(shí)點(diǎn)云幀中的所有關(guān)鍵點(diǎn)變換到地圖的全局坐標(biāo)中。
(2)將預(yù)測(cè)位姿周圍的空間分別按照x,y,yaw三個(gè)維度劃分,得到以下解空間的采樣:
(3)將關(guān)鍵點(diǎn)根據(jù)下式進(jìn)行變換,并提取其在地圖中的特征描述子。
(4)計(jì)算實(shí)時(shí)關(guān)鍵點(diǎn)的描述子與地圖中的描述子之間的歐氏距離,將該距離作為匹配代價(jià)。
3.2、Regularization
正則化步驟通過構(gòu)建3D卷積網(wǎng)絡(luò)實(shí)現(xiàn),這一步驟是為了提高收斂速度并避免過擬合問題。3D卷積網(wǎng)絡(luò)由三個(gè)3D卷積層組成,前兩個(gè)卷積層使用ReLU激活函數(shù)和批處理正則化,其中批處理包含來自單個(gè)幀的所有關(guān)鍵點(diǎn)。最后一個(gè)卷積層則直接輸出解空間的匹配代價(jià)。
4、Probability Offset Volume
此部分作者引入概率偏移量來表述解空間所有關(guān)鍵點(diǎn)的一致性,也就是實(shí)時(shí)點(diǎn)云與地圖在給定偏移量情況下的匹配代價(jià)量。計(jì)算概率偏移量的步驟是
(1)假設(shè)所有關(guān)鍵點(diǎn)是獨(dú)立的,則在某一偏移下的匹配概率為:
(2)將所有關(guān)鍵點(diǎn)的偏移匹配概率累乘并取對(duì)數(shù),得到在偏移為delta_T情況下實(shí)時(shí)點(diǎn)云與地圖的整體匹配概率:
(3)通過reduce average操作將其邊緣化為pasi的成本量。(4)接著通過softmax將上述成本量歸一化,并作為整體的匹配概率。
(5)通過reduce sum操做分別提取x方向,y方向以及航向角pasi的偏移概率向量作為最終輸出。
5、Temporal Smoothness
在傳統(tǒng)算法中,直方圖濾波可以通過歷史的定位分布來推測(cè)當(dāng)前的匹配定位分布,保證了時(shí)間平滑性。在本文中,作者引入RNNs來獲得這一事件平滑效果,更具體的來說,是通過LSTM網(wǎng)絡(luò)實(shí)現(xiàn)。
實(shí)驗(yàn)結(jié)果
從表1中的定位結(jié)果對(duì)比來看,L3-Net在各種場(chǎng)景下的定位精度都達(dá)到很高的水平,實(shí)現(xiàn)了厘米級(jí)定位。在小于0.1m的準(zhǔn)確率上,均高于90%,性能穩(wěn)定。通過是否使用RNN進(jìn)行時(shí)間平滑來的對(duì)比看,經(jīng)過RNN網(wǎng)絡(luò)進(jìn)行時(shí)間平滑后的定位精度有更大的提高。
表1 L3-Net點(diǎn)云定位算法與其他算法的對(duì)比
圖3展示的是成本量、概率偏移量在固定偏航和選定關(guān)鍵點(diǎn)的(x,y)軸上可視化結(jié)果。可以看到,在使用概率偏移量表達(dá)定位匹配度后,匹配結(jié)果更加清晰明了。最右側(cè)一欄是最終估計(jì)的偏移量(0.538m,0.993m,1.001°)及ground truth(0.524m,0.994m,1.044°)的對(duì)比。
圖3 網(wǎng)絡(luò)不同步驟的輸出可視化
結(jié)論
作者提出了一種專為自動(dòng)駕駛應(yīng)用而設(shè)計(jì)的新穎的基于學(xué)習(xí)的LiDAR定位框架。該框架將傳統(tǒng)定位流程中需要手動(dòng)調(diào)整算法的模塊替換為基于學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò),使得定位系統(tǒng)能夠更具魯棒性,定位精度也可以達(dá)到現(xiàn)有(2019)最高水平。
總結(jié)
以上是生活随笔為你收集整理的深度学习LiDAR定位:L3-Net的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 3D深度估计
- 下一篇: 深度学习11个实用技巧