當(dāng)前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

谷歌发明了自主学习机器人，1.5小时即能学会行走

發(fā)布時(shí)間：2023/11/21 综合教程 33 生活家

生活随笔收集整理的這篇文章主要介紹了谷歌发明了自主学习机器人，1.5小时即能学会行走小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

記者 |徐寧

圖片來源：視覺中國

機(jī)器人能自己學(xué)會(huì)走路了。

3月4日，據(jù)國外科技媒體Tech Xplor報(bào)道，谷歌（Google）、佐治亞理工學(xué)院（Georgia Institute of Technology）和加州大學(xué)伯克利分校（UC Berkeley）的研究人員聯(lián)合發(fā)表了一篇論文，詳細(xì)介紹了他們構(gòu)建的一個(gè)通過AI技術(shù)自學(xué)走路的機(jī)器人。

這個(gè)四足機(jī)器人名為Rainbow Dash，它只需花費(fèi)約數(shù)個(gè)小時(shí)，就能自己學(xué)會(huì)向前、向后以及左右轉(zhuǎn)彎等運(yùn)動(dòng)。

論文中的測(cè)試數(shù)據(jù)顯示，Rainbow Dash在堅(jiān)硬平坦的地面上學(xué)會(huì)走路只需要1.5個(gè)小時(shí)，在記憶海綿材質(zhì)的床墊上約需5.5個(gè)小時(shí)，在鏤空的地毯上約需要4.5個(gè)小時(shí)。

四足機(jī)器人名為Rainbow Dash圖片來源：Tech Xplor

此前，大多數(shù)機(jī)器人的強(qiáng)化學(xué)習(xí)都是在建模的仿真環(huán)境中進(jìn)行，直到虛擬機(jī)器人的算法足夠完善，可以安全運(yùn)行，研究人員才會(huì)將搭載該算法的機(jī)器人放置在現(xiàn)實(shí)環(huán)境中實(shí)驗(yàn)。機(jī)器人在行走時(shí)，通常需要人為干預(yù)，如跌倒時(shí)，需要有人扶起來。

這種方法可以避免機(jī)器人在反復(fù)實(shí)驗(yàn)的過程中，對(duì)周圍環(huán)境造成損害。但建模一般耗時(shí)長、費(fèi)用高，且現(xiàn)實(shí)環(huán)境復(fù)雜多變。

將機(jī)器人直接放在現(xiàn)實(shí)環(huán)境中進(jìn)行訓(xùn)練，能夠讓它們很好地適應(yīng)自己所處的環(huán)境以及相似環(huán)境，但這需要技術(shù)的幫助。

Rainbow Dash結(jié)合了深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)兩種不同類型的AI技術(shù)，具備直接放置于真實(shí)環(huán)境中進(jìn)行訓(xùn)練的條件。

該機(jī)器人沒有任何專門的教學(xué)機(jī)制，例如，人工指導(dǎo)或輸入有標(biāo)簽的培訓(xùn)數(shù)據(jù)等。它完全依靠深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)技術(shù)。

深度學(xué)習(xí)技術(shù)可以使機(jī)器人系統(tǒng)處理和評(píng)估其身處的環(huán)境，從而獲得原始數(shù)據(jù)，并組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。

強(qiáng)化學(xué)習(xí)技術(shù)則可以使機(jī)器人的算法反復(fù)試驗(yàn)、學(xué)習(xí)如何執(zhí)行任務(wù)，并根據(jù)完成的程度來獲得獎(jiǎng)勵(lì)。也就是說，當(dāng)機(jī)器人擅長執(zhí)行某個(gè)步驟時(shí)，其獎(jiǎng)勵(lì)會(huì)增加，從而創(chuàng)建一種反饋機(jī)制，促使機(jī)器人學(xué)習(xí)最佳方法。

不過，Rainbow Dash并沒有完全失去人類的干預(yù)。當(dāng)它不小心離開了原本要學(xué)習(xí)的空間，研究人員會(huì)對(duì)其進(jìn)行干預(yù)。例如，研究人員創(chuàng)建了邊界，機(jī)器人可以在該邊界內(nèi)學(xué)習(xí)走路，以防止它離開該區(qū)域。

同時(shí)，研究人員還設(shè)計(jì)了特定的算法來防止機(jī)器人摔倒。

四足機(jī)器人Rainbow Dash在學(xué)習(xí)走路。圖片來源：Tech Xplor

據(jù)《商業(yè)內(nèi)幕》（Business Insider）報(bào)道，谷歌研究負(fù)責(zé)人譚杰（Jan Tan）表示，這項(xiàng)研究花費(fèi)了約一年時(shí)間才完成。

譚杰稱，該研究仍處于早期階段。下一步，研究人員計(jì)劃在各種各樣的機(jī)器人上，以及更多樣化的環(huán)境中測(cè)試這一學(xué)習(xí)系統(tǒng)。

據(jù)Tech Xplor報(bào)道，斯坦福大學(xué)助理教授切爾西·芬恩（Chelsea Finn）表示，將人類干預(yù)從機(jī)器學(xué)習(xí)的過程中撤離，是件很困難的事情。機(jī)器人能夠自主學(xué)習(xí)，將使其能夠更好地適應(yīng)現(xiàn)實(shí)生活世界，而不是在實(shí)驗(yàn)室里。

用AI算法讓機(jī)器人具備自主學(xué)習(xí)能力，是當(dāng)前許多科研人員的研究方向。

據(jù)南加州大學(xué)維特比工程學(xué)院（USC Viterbi School of Engineering）網(wǎng)站消息，3月11日，該校的研究人員發(fā)明了第一個(gè)模擬動(dòng)物類肌腱驅(qū)動(dòng)的機(jī)器人四肢。

圖片來源：Matthew Lin

該機(jī)器人通過算法，能構(gòu)建屬于自己的肢體和環(huán)境內(nèi)部思維導(dǎo)圖，并像動(dòng)物一樣通過三肌腱、雙關(guān)節(jié)肢體等來學(xué)會(huì)如何走路，且不需要明確的編程。

南加州大學(xué)的生物醫(yī)學(xué)工程師弗朗西斯科·瓦萊羅·庫瓦斯（Francisco ValeroCuevas）表示，這項(xiàng)技術(shù)或許能為殘疾人提供反應(yīng)速度更快的假肢，也可能讓機(jī)器人安全地進(jìn)行太空任務(wù)，以及嘗試進(jìn)行一些搜索和救援任務(wù)等。

總結(jié)

以上是生活随笔為你收集整理的谷歌发明了自主学习机器人，1.5小时即能学会行走的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：限制对华贸易，将永久性损害美国半导体产业
下一篇：工信部：加快5G、大数据、人工智能等新基