弹跳机器人 桌游_MIT机器人轻松搞定桌游叠叠乐:你能玩过它算我输 |《科学》子刊...
乾明 發(fā)自 凹非寺 量子位 報(bào)道 | 公眾號 QbitAI
江湖上,一直流傳著一種疊疊樂的試煉。
規(guī)則很簡單,從下方的積木中,抽一根往上搭。
你能往上搭幾層?
對MIT團(tuán)隊(duì)研發(fā)的機(jī)器人來說,玩這個(gè)游戲基本上不費(fèi)吹灰之力。
而且,它只需要訓(xùn)練大約300次就行了,一般的機(jī)器人少說也要訓(xùn)練上萬次。
研究團(tuán)隊(duì)說,這個(gè)機(jī)器人并不醉心疊疊樂。
接下來要進(jìn)軍工業(yè)界,組裝手機(jī)等消費(fèi)產(chǎn)品等等。
疊疊樂有什么難的?
從上面的動(dòng)圖中可以看出,疊疊樂是一個(gè)牽一發(fā)而動(dòng)全身的游戲。
與國際象棋、圍棋等純粹的認(rèn)知任務(wù)或者游戲不同,機(jī)器人需要掌握物理技能,比如探測、推、拉、放置、對齊積木等等。
這就要求它必須進(jìn)行交互的感知和操作,這種情況,是很難在計(jì)算機(jī)上模擬出來的。
機(jī)器人必須要在接觸積木塔的同時(shí),來學(xué)習(xí)如何移動(dòng)積木。
MIT的研究團(tuán)隊(duì)說,關(guān)鍵的挑戰(zhàn)在于,如何利用實(shí)際上的嘗試,從相對較少的實(shí)驗(yàn)中去學(xué)習(xí)。
他們給出的方法是——
聚類學(xué)習(xí),視覺觸覺兩開花
簡單來說,就是搜集視覺觸覺數(shù)據(jù),然后對數(shù)據(jù)聚類,建立相應(yīng)的模型。
為了搜集數(shù)據(jù),研究團(tuán)隊(duì)定制了一個(gè)行業(yè)標(biāo)準(zhǔn)的 ABB IRB 120機(jī)械臂。然后在機(jī)器人能夠觸及的范圍內(nèi)搭建了一個(gè)積木塔,開始第一段的訓(xùn)練期。
機(jī)械臂的配件有3個(gè),一個(gè)是用來操作積木軟齒夾鉗,也可以反饋觸感;一個(gè)是用來控制操作積木的力度的力感應(yīng)腕帶;還有一個(gè)外部攝像頭,用來收集視覺圖像。
想讓機(jī)器人學(xué)會(huì)玩疊疊樂,傳統(tǒng)的做法是收集積木、機(jī)器人、積木塔之間可能發(fā)生的一切。
這顯然會(huì)帶來大量的數(shù)據(jù),在成千上萬次的嘗試中尋找可行的模式,耗費(fèi)的計(jì)算資源可想而知。
MIT研究團(tuán)隊(duì)的做法是,模仿人類玩這個(gè)游戲的方式。
在訓(xùn)練期中,機(jī)器人會(huì)隨機(jī)選擇一個(gè)積木,以及推動(dòng)的積木的位置。 然后用較小的力道,試圖將積木推出塔外。
對于每一次嘗試,計(jì)算設(shè)備都會(huì)記錄相關(guān)的視覺、觸覺、力度等指標(biāo),并標(biāo)注是否成功。
按照這種方法,機(jī)器人只訓(xùn)練大約300次,就對這些測量結(jié)果進(jìn)行聚類分組。
比如,一組數(shù)據(jù)可能代表機(jī)器人在難以移動(dòng)的積木上的嘗試,而另一組數(shù)據(jù)則代表一個(gè)比較容易移動(dòng)的積木上的嘗試。
對于每個(gè)數(shù)據(jù)集群,研究團(tuán)隊(duì)都給機(jī)器人開發(fā)了一個(gè)簡單的模型,根據(jù)當(dāng)前的視覺和觸覺數(shù)據(jù)來預(yù)測移動(dòng)一個(gè)積木的行為。
他們說,讓機(jī)器人建立聚類,然后學(xué)習(xí)每個(gè)聚類的模型,而不是學(xué)習(xí)一個(gè)能完全捕捉可能發(fā)生的一切的模型,能夠極大地提高了機(jī)器人學(xué)習(xí)游戲的效率。
結(jié)合這些模型,機(jī)器人還會(huì)實(shí)時(shí)地“學(xué)習(xí)”,當(dāng)機(jī)器人小心地推動(dòng)一個(gè)積木塊時(shí),計(jì)算機(jī)會(huì)通過它攝像頭和鉗子接收視覺和觸覺反饋,并將這些反饋結(jié)果與機(jī)器人先前做出的動(dòng)作進(jìn)行比較。
然后考慮這個(gè)動(dòng)作的后果,即是否能夠在特定的結(jié)構(gòu)下,用特定的力度,把特定的積木塊抽出來,放到上面,并確保積木塔不倒。
最后,這項(xiàng)研究的論文,已于近日刊發(fā)在了Science Robotics上。
作者為:Nima Fazeli、Miquel Oller、Jiajun Wu、Zheng Wu和Joshua Tenenbaum。
如果你感興趣,請收好傳送門:
See, feel, act: Hierarchical learning for complex manipulation skills with multisensory fusionhttp://robotics.sciencemag.org/content/4/26/eaav3123
總結(jié)
以上是生活随笔為你收集整理的弹跳机器人 桌游_MIT机器人轻松搞定桌游叠叠乐:你能玩过它算我输 |《科学》子刊...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 中国鹰击18导弹发射车
- 下一篇: 南亚军事强国莫卧尔帝国