什么是视觉Visual SLAM
什么是視覺Visual SLAM
What Is Visual SLAM?
What are the origins of visual SLAM? and what are some other
applications for this technology beyond floor cleaning?
視覺Visual SLAM的起源是什么?除了吸塵器,這項(xiàng)技術(shù)還有哪些其他應(yīng)用?
今年CES的獲獎(jiǎng)?wù)咧皇莍Robot的眾多Roombas(特別是s9+真空和清潔底座自動(dòng)污垢處理)。所有Roomba真空吸塵器的一個(gè)獨(dú)特的技術(shù)專長(zhǎng)是它使用了vSLAM,即視覺同步定位和繪圖。
據(jù)iRobot稱,這項(xiàng)技術(shù)使用光學(xué)傳感器每秒捕獲230400個(gè)數(shù)據(jù)點(diǎn)。這使得流動(dòng)真空能夠繪制出它周圍環(huán)境的地圖,包括它自己在那個(gè)環(huán)境中的位置,并繪制出“它在哪里,曾經(jīng)在哪里,以及它需要清潔的地方”
The Roomba s9+ uses iRobot’s patented vSLAM technology. Image used courtesy of iRobot
但是視覺沖擊的起源是什么呢?除了垃圾吸塵器機(jī)器人,這項(xiàng)技術(shù)還有哪些其他應(yīng)用?
What Is Visual SLAM?
通常,SLAM是一種利用傳感器繪制設(shè)備周圍區(qū)域的地圖,同時(shí)將自身定位在該區(qū)域內(nèi)的技術(shù)。聲納和激光成像是這項(xiàng)技術(shù)如何發(fā)揮作用的兩個(gè)例子。
但與激光雷達(dá)(LiDAR)等使用激光陣列繪制區(qū)域地圖的技術(shù)不同,visual slam使用一臺(tái)攝像機(jī)來收集數(shù)據(jù)點(diǎn)并創(chuàng)建地圖。Makhubela等人對(duì)visual SLAM進(jìn)行了一次回顧,他解釋說單視覺傳感器可以是單目、立體視覺、全向或紅綠藍(lán)深度(RGBD)相機(jī)。
沒有單一的算法來執(zhí)行視覺SLAM;此外,據(jù)世界最大的機(jī)器視覺行業(yè)協(xié)會(huì)AIA稱,當(dāng)傳感器的位置及其更廣闊的環(huán)境都未知時(shí),這種技術(shù)使用3D視覺進(jìn)行位置映射。
3D FaceReconstructions and Drone Vision
而Makhubela等人。相信這項(xiàng)技術(shù)還處于初級(jí)階段,visualslam仍然在一些有趣的用例中取得了進(jìn)展。
卡內(nèi)基梅隆機(jī)器人研究所(Carnegie Mellon’s robotics institute)的一個(gè)令人興奮的進(jìn)展是,該研究所發(fā)明了一種用智能手機(jī)視頻創(chuàng)建3D人臉重建的兩步方法。這個(gè)過程的第一步是使用視覺沖擊來三角化人臉表面上的點(diǎn),同時(shí)也使用這些信息來識(shí)別相機(jī)的位置。然后,研究人員使用深度學(xué)習(xí)算法來填補(bǔ)個(gè)人輪廓和面部標(biāo)志(眼睛、耳朵和鼻子)的空白。
Researchers say this method could build avatars for gaming or create customized surgical masks or respirators. Image (modified) used courtesy of Carnegie Mellon University
另一個(gè)視覺沖擊的應(yīng)用是蜻蜓,一個(gè)由Accuware創(chuàng)建的軟件。Accuware擁有自己的專利視覺SLAM方法,用于機(jī)器人和無人機(jī)的3D定位,號(hào)稱定位地圖的精確度為5厘米。然而,該軟件的一個(gè)缺點(diǎn)是,該軟件至少需要16gb的計(jì)算機(jī)RAM,其中大部分用于處理引擎將來自相機(jī)的數(shù)據(jù)轉(zhuǎn)換為地圖。
Accuware表示,他們看到了在自動(dòng)車輛、自動(dòng)機(jī)器人和無人駕駛飛機(jī)上進(jìn)行視覺猛擊的未來,這些機(jī)器人和無人駕駛飛機(jī)用于運(yùn)載以及搜索和救援。
MonoSLAM and PTAM
關(guān)于兩個(gè)最流行的視覺SLAM迭代(MonoSLAM和PTAM:MonoSLAM,一個(gè)實(shí)時(shí)單攝像機(jī)SLAM)的快速歷史課是由Davison等人創(chuàng)建的vSLAM的第一個(gè)實(shí)現(xiàn)。2007年。
從那時(shí)起,研究人員Taketomi等人擴(kuò)展了PTAM(并行跟蹤和映射)技術(shù)。雖然單斯拉姆和PTAM的基本前提相似,但它們?cè)谝恍┲匾矫嬗兴煌?br /> How Does MonoSLAM and PTAM Work?
首先,MonoSLAM和PTAM都必須初始化映射。在MonoSLAM中,這是通過使用已知對(duì)象作為第一個(gè)數(shù)據(jù)點(diǎn)來實(shí)現(xiàn)的。此點(diǎn)允許設(shè)備根據(jù)對(duì)象的已知參數(shù)校準(zhǔn)和縮放其測(cè)量值。另一方面,PTAM通過使用所謂的“五點(diǎn)算法”(一種基于攝像機(jī)相對(duì)運(yùn)動(dòng)估計(jì)位置的過程)來實(shí)現(xiàn)地圖初始化。
接下來,兩種視覺SLAM技術(shù)都執(zhí)行跟蹤和定位,這就是真正神奇的地方。在MonoSLAM中,該技術(shù)使用一種稱為擴(kuò)展Kalman濾波器的數(shù)學(xué)過程來估計(jì)相機(jī)的運(yùn)動(dòng),并找到“特征點(diǎn)”的三維坐標(biāo),這些特征點(diǎn)是記錄在地圖上的三維結(jié)構(gòu)和物體。
Map created by Accuware’s Dragonfly. Image used courtesy of Accuware
PTAM匹配特征點(diǎn),以估計(jì)當(dāng)前地圖點(diǎn)和來自相機(jī)的最新輸入圖像之間的相機(jī)位置。然后使用三角剖分創(chuàng)建三維位置,并使用捆綁算法優(yōu)化這些數(shù)據(jù)點(diǎn)。AIA描述了捆綁算法如何利用montecarlo分析從多個(gè)數(shù)據(jù)點(diǎn)中找出一個(gè)平均位置。
如Taketomi等人。解釋一下,PTAM,以及visualslam的許多后期實(shí)現(xiàn),使用重定位和全局地圖優(yōu)化來優(yōu)化攝像機(jī)位置和地圖環(huán)境。
Challenges of Visual SLAM: Motion and Light
雖然視覺沖擊顯示出機(jī)器人技術(shù)的前景,但研究表明,這項(xiàng)技術(shù)有幾個(gè)主要問題。
一個(gè)重要的原因是它在處理動(dòng)態(tài)環(huán)境方面的局限性。視覺沖擊必須實(shí)時(shí)操作。但是,由于只有一個(gè)攝像頭,視覺SLAM無法提供360度的視野,Makhubela等人。解釋一下。這意味著系統(tǒng)必須以極高的速度工作,以捕捉環(huán)境變化并在短時(shí)間內(nèi)覆蓋整個(gè)觀察區(qū)域。
Makhubela等人。斷言這些動(dòng)態(tài)限制導(dǎo)致了協(xié)作SLAM(CoSLAM),它使用多個(gè)攝像機(jī)執(zhí)行視覺SLAM。CoSLAM修復(fù)了限制觀看區(qū)域的問題,但增加了處理負(fù)擔(dān)。也就是說,需要一臺(tái)更強(qiáng)大的計(jì)算機(jī)來保持系統(tǒng)的實(shí)時(shí)運(yùn)行。
光變差是Makhubela等人的另一個(gè)問題。引用。也就是說,從室內(nèi)到室外環(huán)境之間的反射面和光線變化會(huì)阻礙數(shù)據(jù)點(diǎn)。換言之,鏡像屋不是一個(gè)視覺猛擊可以輕松操控的地方。
What’s Your Take on SLAM?
雖然視覺重?fù)粼谠S多領(lǐng)域顯示出了希望,特別是在無人機(jī)和機(jī)器人設(shè)計(jì)中,但它仍然存在動(dòng)態(tài)運(yùn)動(dòng)和光照的問題。但是我們想聽聽你對(duì)總體技術(shù)的經(jīng)驗(yàn)。
總結(jié)
以上是生活随笔為你收集整理的什么是视觉Visual SLAM的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是智能医院?如何构建自己的解决方案?
- 下一篇: Comparison of Laser