谷歌发明了自主学习机器人,1.5小时即能学会行走
記者 |徐寧
圖片來源:視覺中國
機(jī)器人能自己學(xué)會(huì)走路了。
3月4日,據(jù)國外科技媒體Tech Xplor報(bào)道,谷歌(Google)、佐治亞理工學(xué)院(Georgia Institute of Technology)和加州大學(xué)伯克利分校(UC Berkeley)的研究人員聯(lián)合發(fā)表了一篇論文,詳細(xì)介紹了他們構(gòu)建的一個(gè)通過AI技術(shù)自學(xué)走路的機(jī)器人。
這個(gè)四足機(jī)器人名為Rainbow Dash,它只需花費(fèi)約數(shù)個(gè)小時(shí),就能自己學(xué)會(huì)向前、向后以及左右轉(zhuǎn)彎等運(yùn)動(dòng)。
論文中的測(cè)試數(shù)據(jù)顯示,Rainbow Dash在堅(jiān)硬平坦的地面上學(xué)會(huì)走路只需要1.5個(gè)小時(shí),在記憶海綿材質(zhì)的床墊上約需5.5個(gè)小時(shí),在鏤空的地毯上約需要4.5個(gè)小時(shí)。
此前,大多數(shù)機(jī)器人的強(qiáng)化學(xué)習(xí)都是在建模的仿真環(huán)境中進(jìn)行,直到虛擬機(jī)器人的算法足夠完善,可以安全運(yùn)行,研究人員才會(huì)將搭載該算法的機(jī)器人放置在現(xiàn)實(shí)環(huán)境中實(shí)驗(yàn)。機(jī)器人在行走時(shí),通常需要人為干預(yù),如跌倒時(shí),需要有人扶起來。
這種方法可以避免機(jī)器人在反復(fù)實(shí)驗(yàn)的過程中,對(duì)周圍環(huán)境造成損害。但建模一般耗時(shí)長、費(fèi)用高,且現(xiàn)實(shí)環(huán)境復(fù)雜多變。
將機(jī)器人直接放在現(xiàn)實(shí)環(huán)境中進(jìn)行訓(xùn)練,能夠讓它們很好地適應(yīng)自己所處的環(huán)境以及相似環(huán)境,但這需要技術(shù)的幫助。
Rainbow Dash結(jié)合了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)兩種不同類型的AI技術(shù),具備直接放置于真實(shí)環(huán)境中進(jìn)行訓(xùn)練的條件。
該機(jī)器人沒有任何專門的教學(xué)機(jī)制,例如,人工指導(dǎo)或輸入有標(biāo)簽的培訓(xùn)數(shù)據(jù)等。它完全依靠深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù)。
深度學(xué)習(xí)技術(shù)可以使機(jī)器人系統(tǒng)處理和評(píng)估其身處的環(huán)境,從而獲得原始數(shù)據(jù),并組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。
強(qiáng)化學(xué)習(xí)技術(shù)則可以使機(jī)器人的算法反復(fù)試驗(yàn)、學(xué)習(xí)如何執(zhí)行任務(wù),并根據(jù)完成的程度來獲得獎(jiǎng)勵(lì)。也就是說,當(dāng)機(jī)器人擅長執(zhí)行某個(gè)步驟時(shí),其獎(jiǎng)勵(lì)會(huì)增加,從而創(chuàng)建一種反饋機(jī)制,促使機(jī)器人學(xué)習(xí)最佳方法。
不過,Rainbow Dash并沒有完全失去人類的干預(yù)。當(dāng)它不小心離開了原本要學(xué)習(xí)的空間,研究人員會(huì)對(duì)其進(jìn)行干預(yù)。例如,研究人員創(chuàng)建了邊界,機(jī)器人可以在該邊界內(nèi)學(xué)習(xí)走路,以防止它離開該區(qū)域。
同時(shí),研究人員還設(shè)計(jì)了特定的算法來防止機(jī)器人摔倒。
據(jù)《商業(yè)內(nèi)幕》(Business Insider)報(bào)道,谷歌研究負(fù)責(zé)人譚杰(Jan Tan)表示,這項(xiàng)研究花費(fèi)了約一年時(shí)間才完成。
譚杰稱,該研究仍處于早期階段。下一步,研究人員計(jì)劃在各種各樣的機(jī)器人上,以及更多樣化的環(huán)境中測(cè)試這一學(xué)習(xí)系統(tǒng)。
據(jù)Tech Xplor報(bào)道,斯坦福大學(xué)助理教授切爾西·芬恩(Chelsea Finn)表示,將人類干預(yù)從機(jī)器學(xué)習(xí)的過程中撤離,是件很困難的事情。機(jī)器人能夠自主學(xué)習(xí),將使其能夠更好地適應(yīng)現(xiàn)實(shí)生活世界,而不是在實(shí)驗(yàn)室里。
用AI算法讓機(jī)器人具備自主學(xué)習(xí)能力,是當(dāng)前許多科研人員的研究方向。
據(jù)南加州大學(xué)維特比工程學(xué)院(USC Viterbi School of Engineering)網(wǎng)站消息,3月11日,該校的研究人員發(fā)明了第一個(gè)模擬動(dòng)物類肌腱驅(qū)動(dòng)的機(jī)器人四肢。
該機(jī)器人通過算法,能構(gòu)建屬于自己的肢體和環(huán)境內(nèi)部思維導(dǎo)圖,并像動(dòng)物一樣通過三肌腱、雙關(guān)節(jié)肢體等來學(xué)會(huì)如何走路,且不需要明確的編程。
南加州大學(xué)的生物醫(yī)學(xué)工程師弗朗西斯科·瓦萊羅·庫瓦斯(Francisco ValeroCuevas)表示,這項(xiàng)技術(shù)或許能為殘疾人提供反應(yīng)速度更快的假肢,也可能讓機(jī)器人安全地進(jìn)行太空任務(wù),以及嘗試進(jìn)行一些搜索和救援任務(wù)等。
總結(jié)
以上是生活随笔為你收集整理的谷歌发明了自主学习机器人,1.5小时即能学会行走的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 限制对华贸易,将永久性损害美国半导体产业
- 下一篇: 工信部:加快5G、大数据、人工智能等新基