人工智能正在学习如何创造自己
人類一直在努力制造真正的智能機器??
也許我們需要讓他們自己處理
一個長著楔形頭的小棍子在屏幕上晃來晃去。它半蹲著移動,沿著地面拖著一個膝蓋。它在走路!呃,有點。
不過王銳還是很高興的。“每天我走進我的辦公室,打開我的電腦,我不知道會發生什么,”他說。
作為 Uber 的人工智能研究員,Wang 喜歡讓 Paired Open-Ended Trailblazer(他幫助開發的一款軟件)在他的筆記本電腦上運行一夜。POET 是一種針對虛擬機器人的訓練道場。到目前為止,他們根本沒有學會做很多事情。這些 AI 代理不是在下圍棋,也沒有發現癌癥的跡象,也沒有折疊蛋白質——他們試圖在由柵欄和峽谷組成的粗糙卡通景觀中穿行而不會摔倒。
? ? ??該視頻介紹了一種稱為 POET(配對開放式開拓者)的算法,該算法旨在不斷發明日益復雜和多樣化的問題及其相應的解決方案。在這里,我們通過在二維景觀的問題空間和旨在遍歷它們的機器人行為的解決方案空間上釋放它來展示 POET 的潛力。在這個領域,POET 通過修改先前解決的景觀并應用和改進先前發現的成功機器人步態的實驗,構建了一系列已解決的景觀。該過程最終使機器人能夠熟練地穿越崎嶇不平、充滿障礙的景觀,這些景觀在使用標準優化技術孤立地接近時是無法解決的。結論是 POET 代表了朝著真正開放式機器學習算法邁出的一步,該算法不斷發明和解決新的挑戰。
但令人興奮的并不是機器人正在學習的東西——而是它們的學習方式。POET 生成障礙課程,評估機器人的能力,并分配他們的下一個挑戰,所有這些都不需要人工參與。機器人步步蹣跚,通過反復試驗不斷改進。“在某些時候,它可能會像功夫大師一樣跳過懸崖,”王說。
目前看來,這似乎很基礎,但對于王和其他一些研究人員來說,POET 暗示了一種創造超級智能機器的革命性新方法:讓人工智能自我制造。
Wang 的前同事 Jeff Clune 是這個想法的最大推動者之一。Clune 多年來一直在研究它,首先在懷俄明大學,然后在 Uber AI Labs,在那里他與 Wang 和其他人一起工作。現在,他在不列顛哥倫比亞大學和 OpenAI 之間分配時間,得到了世界頂級人工智能實驗室之一的支持。
Clune 將構建真正智能的 AI 的嘗試稱為人類歷史上最雄心勃勃的科學探索。今天,在人工智能開始認真努力七年之后,我們距離創造出與人類幾乎一樣聰明的機器還有很長的路要走,更不用說更聰明了。Clune 認為 POET 可能指向一條捷徑。
“我們需要擺脫束縛,走出自己的道路,”他說。
如果 Clune 是對的,那么使用 AI 制造 AI可能是有朝一日通向通用人工智能(AGI)的重要一步——機器可以超越人類。在近期,這項技術還可能幫助我們發現不同類型的智能:非人類智能可以以意想不到的方式找到解決方案,并可能補充而不是取代我們自己的智能。
模仿進化
去年年初,就在他轉向 OpenAI 幾周后,我第一次與 Clune 談論了這個想法。他很樂意討論過去的工作,但對他與新團隊所做的事情保持緘默。與其在里面接電話,他更喜歡在我們談話時在辦公室外的街道上走來走去。
Clune 只會說 OpenAI 非常適合。“我的想法與他們相信的許多事情非常一致,”他說。“這有點像天造地設的婚姻。他們喜歡這個愿景,并希望我來這里追求它。” 在 Clune 加入幾個月后,OpenAI 也雇傭了他的大部分 Uber 老團隊。
Clune 雄心勃勃的愿景不僅僅基于 OpenAI 的投資。人工智能的歷史充滿了人類設計的解決方案讓位于機器學習的解決方案的例子。以計算機視覺為例:十年前,當現有的手工系統被從頭開始自學的系統所取代時,圖像識別領域取得了重大突破。許多人工智能的成功都是如此。
人工智能,尤其是機器學習,最吸引人的地方之一是它能夠找到人類尚未找到的解決方案——讓我們大吃一驚。一個經常被引用的例子是 AlphaGo(及其繼任者 AlphaZero),它通過采用看似陌生的策略,在古老而迷人的圍棋游戲中擊敗了人類所能提供的最好的東西。經過人類大師數百年的研究,人工智能找到了沒人想過的解決方案。
Clune 現在正在與 OpenAI 的一個團隊合作,該團隊開發 ?了 2018 年學會在虛擬環境中玩捉迷藏的機器人。這些 AI 從簡單的目標和實現這些目標的簡單工具開始:一對必須找到另一個,這可以躲在可移動的障礙物后面。然而,當這些機器人開始學習時,它們很快就找到了以研究人員沒有預見到的方式利用環境的方法。他們利用虛擬世界模擬物理中的小故障跳過甚至穿過墻壁。
這類意外的突發行為提供了誘人的暗示,即人工智能可能會找到人類自己無法想到的技術解決方案,發明新的、更高效的算法或神經網絡,甚至完全拋棄神經網絡,這是現代人工智能的基石。
Clune 喜歡提醒人們,智能已經從簡單的開始出現了。“這種方法的有趣之處在于我們知道它可以奏效,”他說。“達爾文進化的非常簡單的算法產生了你的大腦,而你的大腦是迄今為止我們所知道的宇宙中最智能的學習算法。” 他的觀點是,如果我們所知道的智力是由無數代無意識的基因突變產生的,為什么不尋求復制智力產生過程——這可以說是更簡單——而不是智力本身?
但這里還有另一個重要的觀察。智能從來都不是進化的終點,也不是目標。相反,它以許多不同的形式出現,來自無數微小的挑戰,使生物能夠生存并迎接未來的挑戰。情報是當前持續和開放式進程中的最高點。從這個意義上說,進化與人們通常認為的算法大不相同——作為達到目的的手段。
正是這種開放性,從 POET 產生的顯然漫無目的的一系列挑戰中窺見一斑,Clune 和其他人認為這可能會導致新型 AI。幾十年來,人工智能研究人員一直試圖構建算法來模仿人類智能,但真正的突破可能來自構建試圖模仿進化的開放式解決問題的算法——然后坐下來觀察出現的情況。
研究人員已經在自身使用機器學習,對其進行訓練以找到該領域一些最困難問題的解決方案,例如如何制造能夠一次學習多項任務或應對以前從未遇到過的情況的機器。現在有些人認為采用這種方法并運行它可能是通向通用人工智能的最佳途徑。“我們可以啟動一個最初內部沒有太多智能的算法,然后看著它自我引導,一直到 AGI,”Clune 說。
事實是,就目前而言,AGI 仍然是一種幻想。但這主要是因為沒有人知道如何制作它。人工智能的進步是零碎的,由人類完成,進步通常涉及對現有技術或算法的調整,從而在性能或準確性方面產生增量飛躍。Clune 將這些努力描述為在不知道您在尋找什么或需要多少塊的情況下發現人工智能的構建塊的嘗試。而這只是開始。“在某些時候,我們必須承擔將它們整合在一起的艱巨任務,”他說。
要求人工智能為我們尋找和組裝這些構建塊是一種范式轉變。它是說我們想創造一個智能機器,但我們不在乎它看起來像什么——只要給我們任何有用的東西。
即使永遠無法實現 AGI,自學方法仍可能會改變創建的 AI 類型。Clune 說,世界需要的不僅僅是一個非常好的圍棋選手。對他來說,創造一臺超級智能機器意味著建立一個系統,它可以發明自己的挑戰,解決它們,然后發明新的挑戰。POET 是這一行動的一小部分。Clune 設想了一種機器,可以教機器人走路,然后玩跳房子,然后可能會下圍棋。“然后它可能會學習數學謎題并開始發明自己的挑戰,”他說。“該系統不斷創新,就其可能去向而言,天空是無限的。”
也許這是一種瘋狂的猜測,但一個希望是,像這樣的機器可能能夠避開我們的概念死胡同,幫助我們解決氣候變化或全球健康等極其復雜的危機。
但首先我們必須制作一個。
如何創造大腦
有許多不同的方法來連接人工大腦。
神經網絡由軟件編碼的多層人工神經元組成。每個神經元都可以連接到上面層中的其他神經元。神經網絡的連接方式有很大的不同,新的架構往往會帶來新的突破。
人類科學家編碼的神經網絡通常是反復試驗的結果。關于什么行得通,什么行不通,幾乎沒有理論,也不能保證找到了最好的設計。這就是為什么至少自 1980 年代以來,自動化尋找更好的神經網絡設計一直是人工智能領域最熱門的話題之一。自動化該過程的最常見方法是讓 AI 生成許多可能的網絡設計,并讓網絡自動嘗試每一個并選擇最好的。這通常稱為神經進化或神經架構搜索 (NAS)。
在過去的幾年里,這些機器設計已經開始超越人類設計。2018 年,Esteban Real 和他在谷歌的同事使用 NAS 生成了一個用于圖像識別的神經網絡,該網絡擊敗了當時最好的人工設計網絡。那真是讓人大開眼界。
2018 年的系統是正在進行的名為 AutoML 的谷歌項目的一部分,該項目還使用 NAS 生成了 EfficientNets,這是一個比人類設計的模型更高效的深度學習模型系列,在圖像識別任務上實現了高水平的準確性更小、更快的模型。
三年過去了,Real 正在突破可以從頭開始生成的界限。早期的系統只是重新排列了經過試驗和測試的神經網絡部分,例如現有類型的層或組件。“我們可以期待一個好的答案,”他說。
去年,Real 和他的團隊卸下了訓練輪。這個名為AutoML Zero的新系統 試圖從頭開始構建人工智能,只使用管理機器學習的最基本數學概念。
令人驚訝的是,AutoML Zero 不僅自發地構建了一個神經網絡,而且還提出了梯度下降,這是人類設計師用來訓練網絡的最常見的數學技術。“我很驚訝,”Real 說。“這是一個非常簡單的算法——它需要六行代碼——但它寫了準確的六行。”
AutoML Zero 尚未生成與人工設計系統性能相媲美的架構——或者確實做了很多人類設計師不會做的事情。但皇馬相信有朝一日可以做到。
是時候培養一種新的老師了
首先你制造一個大腦;那么你必須教它。但是機器大腦不像我們的大腦那樣學習。我們的大腦非常擅長適應新環境和新任務。今天的人工智能可以在特定條件下解決挑戰,但在這些條件稍有變化時就會失敗。這種不靈活性阻礙了創建更通用的人工智能的探索,這些人工智能可以在廣泛的場景中有用,這將是使它們真正智能的一大步。
對于倫敦 DeepMind 的研究員 Jane Wang 而言,讓 AI 更加靈活的最佳方法是讓它自己學習該特征。換句話說,她想建立一個人工智能,它不僅可以學習特定的任務,還可以學習以適應新情況的方式學習這些任務。
多年來,研究人員一直試圖讓人工智能更具適應性。Wang 認為讓 AI 自己解決這個問題可以避免手工設計方法的一些嘗試和錯誤:“我們不可能指望立即偶然發現正確的答案。” 她希望,在這個過程中,我們也能更多地了解大腦是如何工作的。“關于人類和動物的學習方式,我們還有很多不了解,”她說。
自動生成學習算法有兩種主要方法,但都從現有的神經網絡開始,并使用 AI 來教授它。
第一種方法是由 Wang 和她在 DeepMind 的同事 以及OpenAI的 一個團隊 同時分別發明的,它使用循環神經網絡。這種類型的網絡可以通過這樣一種方式進行訓練,即它們的神經元的激活——大致類似于生物大腦中神經元的激活——可以編碼任何類型的算法。DeepMind 和 OpenAI 利用這一點來訓練循環神經網絡以生成強化學習算法,該算法告訴 AI 如何表現以實現給定目標。
結果是,DeepMind 和 OpenAI 系統不會學習解決特定挑戰(例如識別圖像)的算法,而是學習可應用于多個任務并隨其進行調整的 學習 算法。這就像教人釣魚的古老格言:雖然手工設計的算法可以學習特定的任務,但這些人工智能正在學習如何自己學習。其中一些比人工設計的表現更好。
第二種方法來自加州大學伯克利分校的 Chelsea Finn 和她的同事。稱為與模型無關的元學習或 MAML,它使用兩個機器學習過程訓練模型,一個嵌套在另一個中。
粗略地說,這是它的工作原理。MAML 中的內部過程在數據上進行訓練,然后像往常一樣進行測試。但是,外部模型會利用內部模型的性能——比如它識別圖像的能力——并使用它來學習如何調整該模型的學習算法以提高性能。就好像你有一個學校督察監督一群老師,每個老師都提供不同的學習技巧。檢查員檢查哪些技術可以幫助學生獲得最好的分數并相應地調整它們。
通過這些方法,研究人員正在構建更強大、更通用且能夠以更少的數據更快地學習的 AI。例如,Finn 想要一個已經學會在平地上行走的機器人,只需很少的額外訓練,就能夠過渡到在斜坡上、草地上行走或在搬運負載時行走。
去年,Clune 和他的同事擴展了 Finn 的技術來設計一種算法,該算法使用較少的神經元進行學習,這樣它就不會覆蓋之前學到的所有內容,這是機器學習中一個未解決的大問題,稱為災難性遺忘。使用較少神經元的訓練模型,稱為“稀疏”模型,在重新訓練時將有更多未使用的神經元用于新任務,這意味著較少的“已使用”神經元將被覆蓋。Clune 發現,將他的 AI 設置為學習多個任務的挑戰,導致它想出了自己的稀疏模型版本,該版本的性能優于人類設計的模型。
如果我們全力以赴讓 AI 創造和自學,那么 AI 也應該生成自己的訓練環境——學校和教科書,以及課程計劃。
在過去的一年里,出現了大量的項目,其中人工智能已經接受了自動生成數據的訓練。例如,人臉識別系統正在接受人工智能生成的人臉的訓練。AI 也在學習如何相互訓練。在最近的一個例子中,兩只機器人手臂一起工作,一只手臂學習設置越來越難的積木挑戰,訓練另一只手臂抓握物體。
事實上,Clune 想知道人類對于 AI 需要什么樣的數據才能學習的直覺是否可能會消失。例如,他和他的同事開發了他所謂的生成式教學網絡,它了解在訓練模型時應該生成哪些數據以獲得最佳結果。在一項實驗中,他使用其中一個網絡來調整通常用于訓練圖像識別算法的手寫數字數據集。它得出的結果看起來與原始人工策劃的數據集大不相同:數百個不完全是數字,例如數字 7 的上半部分或看起來像兩個數字合并在一起的數字。一些 AI 生成的示例根本難以破譯。盡管如此,人工智能生成的數據在訓練手寫識別系統識別實際數字方面仍然做得很好。
不要試圖成功
AI 生成的數據仍然只是難題的一部分。長期愿景是將所有這些技術——以及其他尚未發明的技術——交給人工智能訓練師,控制人工大腦的連接方式、訓練方式以及訓練內容。甚至 Clune 也不清楚這樣一個未來的系統會是什么樣子。有時他會談論一種超現實的模擬沙盒,人工智能可以在其中切齒并剝去虛擬膝蓋的皮。這么復雜的事情還需要幾年的時間。最接近的是 POET,這是 Clune 與 Uber 的王銳等人創建的系統。
王說,POET 的動機是一個悖論。如果你試圖解決一個問題,你就會失敗;如果你不嘗試解決它,你就更有可能成功。這是 Clune 從他與進化的類比中得出的見解之一——從明顯隨機的過程中產生的驚人結果往往無法通過朝著同一目的采取刻意步驟來重新創造。毫無疑問,蝴蝶是存在的,但回到它們的單細胞前體,并嘗試通過選擇從細菌到昆蟲的每一步來從頭開始創造它們,你很可能會失敗。
POET 在一個簡單的環境中啟動它的雙腿代理,例如沒有障礙物的平坦路徑。起初,agent 不知道如何處理它的腿,也不能走路。但是通過反復試驗,控制它的強化學習算法學會了如何沿著平坦的地面移動。然后 POET 生成一個新的隨機環境,該環境不同,但不一定更難進入。代理嘗試走到那里。如果在這個新環境中存在障礙,代理將學習如何克服或跨越這些障礙。每次代理成功或卡住時,它都會被轉移到一個新環境。隨著時間的推移,智能體學會了一系列步行和跳躍動作,讓他們能夠在越來越難的障礙路線中導航。
該團隊發現隨機切換環境至關重要。
例如,智能體有時會學會在平坦的地面上以一種奇怪的、半跪著的方式走路,因為這已經足夠了。“他們永遠不會學會站起來,因為他們永遠不需要,”王說。但是,在他們被迫在布滿障礙的地面上學習替代策略之后,他們可以以更好的步行方式返回到早期階段——比如說,用雙腿而不是拖著一條腿——然后將自己的改進版本向前推進迎接更艱巨的挑戰。
POET 以一種人類無法做到的方式訓練其機器人——它需要通過不穩定、不直觀的方式獲得成功。在每個階段,機器人都會嘗試找出解決方案來應對他們面臨的任何挑戰。通過應對隨機選擇的障礙物,他們總體上會變得更好。但是這個過程沒有終點,沒有通過的終極測試或高分。
Clune、Wang 和他們的一些同事認為這是一個深刻的見解。他們現在正在探索這對超級智能機器的發展可能意味著什么。嘗試 不 繪制特定路徑是否真的可以成為通向通用人工智能的關鍵突破?
POET 已經激勵了其他研究人員,例如加州大學伯克利分校的 Natasha Jaques 和 Michael Dennis。他們開發了一個名為PAIRED的系統,該系統使用 AI 生成一系列迷宮來訓練另一個 AI 來導航它們。
王銳認為人為設計的挑戰將成為一個瓶頸,人工智能的真正進步將需要人工智能提出自己的問題。“無論今天的算法有多好,它們總是在一些手工設計的基準上進行測試,”他說。“很難想象通用人工智能由此而來,因為它受到固定目標的約束。”
一種新型智能
可以自我訓練的人工智能的快速發展也引發了我們如何控制其增長的問題。AI 構建更好 AI 的想法是“奇點”背后神話的重要組成部分,“奇點”是未來 AI 開始以指數速度改進并超出我們控制范圍的想象點。最終,某些末日論者警告說,人工智能可能會決定它根本不需要人類。
這不是這些研究人員的想法:他們的工作非常專注于使當今的人工智能變得更好。瘋狂運行的機器仍然是一種遙遠的反幻想。
即便如此,DeepMind 的 Jane Wang 還是有所保留。使用 AI 制造 AI 的一大吸引力在于,它可以提出人們沒有想到的設計和技術。然而,Wang 指出,并非所有的驚喜都是好的驚喜:“開放性,顧名思義,就是出乎意料的事情。” 如果整個想法是讓 AI 做一些你沒有預料到的事情,它就會變得更難控制。“這既令人興奮又令人恐懼,”她說。
Clune 還強調從一開始就考慮新技術倫理的重要性。人工智能設計的神經網絡和算法很有可能比今天已經不透明的黑盒系統更難理解。算法生成的 AI 是否更難審計偏見?是否更難保證他們不會以不良方式行事?
Clune 希望隨著更多人意識到自生 AI 的潛力,這些問題將得到提出和回答。“機器學習社區中的大多數人從來沒有真正談論過我們通向極其強大的人工智能的整體路徑,”他說——相反,他們傾向于專注于小的、漸進的改進。Clune 想再次開始討論該領域最大的野心。
他自己的野心與他早期對人類智能及其進化方式的興趣有關。他的宏偉愿景是進行設置,以便機器有一天可以看到自己的智能——或智能——通過無數代的反復試驗出現和改進,由算法指導,沒有最終藍圖。
如果人工智能開始自己產生智能,就不能保證它會像人類一樣。機器可能會教人類新的思維方式,而不是人類教機器像人類一樣思考。
“變得非常聰明可能有很多不同的方式,”Clune 說。“人工智能讓我興奮的一件事是,我們可能會通過看到可能的變化來更廣泛地理解智能。
“我認為這很吸引人。我的意思是,這幾乎就像發明了星際旅行并能夠去參觀外星文化。人類歷史上沒有比遇到外星種族并了解其文化、科學和一切更重要的時刻了。星際旅行極其困難,但我們有能力以數字方式創造外星智能。”
可關注 網絡研究院 公眾號內回復“20210806”獲取
人工智能資料包?下載鏈接
更有不限速下載等著你。
每日堅持分享,如果你覺得有所收獲,請各位讀者點亮“點贊” “再看”,
感激不盡
總結
以上是生活随笔為你收集整理的人工智能正在学习如何创造自己的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信升级外链管理规范,「砍一刀帮我加速」
- 下一篇: rsync来实现文件同步