Google AI 系统 DeepMind 高中数学考试不及格
Google 旗下 DeepMind 團隊讓 AI 系統接受一項高中程度的數學測試,結果在 40 道題目中只答對了 14 題,甚至連「1+1+1+1+1+1+1」也算錯了。說來難以置信,Google AI 系統能打敗人類世界棋王,卻無法通過高中程度的數學考試。
?。╥mgsource / pixabay)
上周,Google 旗下 DeepMind 團隊公布了一份名為《分析神經模型的數學推理能力》的研究報告。在這項研究中,DeepMind 團隊讓 AI 系統接受一項涵括算術、幾何、概率、測量和微積分的數學測試,考題有 40 題,難度大約是英國高中數學的程度。
結果 DeepMind 雖然在一些題目上表現不錯,但是碰上文字、加減乘除符號、函數等組成的問題時,卻因看不懂題目而無法作答。最后,在 40 道題目中,這個人工智能系統只答對 14 題,拿到「E」的分數,也就是說 —— 不及格。
其中有一道題目是「1+1+1+1+1+1+1」,連小學生都知道答案是 7,但 DeepMind 卻答成了6。
研究人員解釋,DeepMind 神經模型最長可以計算出現次數(n) 6 次以下的數值,但如果 n = 7,它就算不出來。當 AI 碰到同一數字出現多次,它會認為輸入值是出錯的。奇怪的是,碰上更長的加法題目,DeepMind 卻算得出來。研究人員承認還找不出很好的解釋,但很可能是因為 AI 神經網絡不斷觀察每道問題,從而做出正確的解答。
此外,當研究人員要求 DeepMind 在一長串數字中找出「位值」(place value),它就能答得很好,因為它可以按數字大小排出順序,也能將小數四舍五入。
研究人員說,人類智慧優于神經模型之處,在于對于事物復合式推論的能力。推論是一種復雜、多面向能力的展現。在解答問題時,人腦動用了多種認知能力,包括將符號分類(如區分數字、加減乘除符號、文字、變量)、規劃(如找出正確順序的函數)、演算、運用工作記憶來儲存中間值、還要運用學到的規則或定理等。相反的,以卷積和遞歸神經網絡發展出的 DeepMind 擅長模式比對、機器翻譯和強化式學習,但彈性遠不及人腦。它們不太能將事物推論到已有經驗的環境外,更無法處理刻意亂輸入的資訊。
目前 AI 或許當不成數學老師,但也已經相當厲害。DeepMind 公司的 AlphaGo 接連打敗人類圍棋冠軍李世乭、柯潔。去年 12 月 DeepMind 的 AlphaZero 又在星海爭霸 2(StarCraft II)測試賽中,以 5 比 0 打贏世界頂尖職業玩家。此外,自學畫畫、創作音樂也都難不倒 AI。
總結
以上是生活随笔為你收集整理的Google AI 系统 DeepMind 高中数学考试不及格的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 反转?MIT女博士遭质疑:代码贡献太少,
- 下一篇: SpaceX获NASA七千万美元合同:进