直播实录 | AlphaGo Zero是如何实现无师自通的?
本文為 10 月 29 日,圣何塞州立大學——劉遙行的論文共讀直播分享實錄。
Google DeepMind 團隊在 Nature 上發表的最新論文,闡述了新版 AlphaGo 是如何從空白狀態學起,不使用任何人類棋譜,通過自對弈強化學習,僅用 3 天訓練時間就以 100:0 擊敗了上一版本的 AlphaGo,并用 21 天達到 AlphaGo Master 水平。
AlphaGo Zero 的核心在于強化學習下的自我博弈。本期論文共讀,我們邀請到?深入淺出看懂AlphaGo Zero?一文的作者,圣何塞州立大學研究生劉遙行,帶大家揭秘 AlphaGo 的前世今生。
>>>>
?獲取完整PPT
關注“PaperWeekly”微信公眾號,回復“20171029”獲取下載鏈接。
? ? ?直播實錄? ? ?
?AlphaGo Zero是如何實現無師自通的?
AlphaGo Zero
論文解讀√在線討論√
活動形式:語音直播
?
?活動時間?
10 月 29 日(周日)13:00-14:15
45 min 串講 + 30 min 討論
?
長按識別二維碼觀看實錄
*報名成功后,即可進入直播間回看實錄
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 回看實錄
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的直播实录 | AlphaGo Zero是如何实现无师自通的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 这 8 份「Paper + Code」,
- 下一篇: 免费课程 | 云脑机器学习实战训练营,中