NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR
上周我們發布了《攻略 | 雖然票早已被搶光,你可以從機器之心關注 NIPS 2017》,在 NIPS 2017 正式開始前,我們將選出數篇優質論文,邀請論文作者來做線上分享,聊聊理論、技術和研究方法。
所以,第一期分享來了。
北京時間 11 月 8 日 20:00 至 21:00,多倫多大學在讀三年級博士生 Yuhuai Wu(吳宇懷)將為大家分享一篇 NIPS 2017 論文《Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation》。
分享者簡介
Yuhuai Wu(吳宇懷),多倫多大學在讀三年級博士生,師從 Roger Grosse。曾在 Geoffrey Hinton、Yoshua Bengio、Ruslan Salakhutdinov 等指導下做研究。主要研究方向是優化算法、強化學習。是 2017 年 Google fellowship in machine learning 的得主之一。2017 暑假于 OpenAI 做實習,開源了 ACKTR 算法。
演講主題
這次演講主要研討一個最近研發的似自然梯度的優化算法 -- KFAC(似二階算法)。我們將其用在強化學習的問題上,并提出了新的強化學習算法 -- ACKTR,發現比前人的算法有效 2-3 倍。
針對這篇論文,機器之心曾發布過一篇簡介:《OpenAI 開源算法 ACKTR 與 A2C:把可擴展的自然梯度應用到強化學習》,請大家做課前預習。
參與方式
線上分享將在「NIPS 2017 機器之心官方學霸群」中進行。加群方式:長按掃描下方二維碼,添加「機器之心小助手Ⅱ」,備注暗號:147,由小助手拉大家入群。
戳「閱讀原文」,查看機器之心 NIPS 2017 專題策劃并參與其中。
總結
以上是生活随笔為你收集整理的NIPS 2017 | 线上分享第一期:似自然梯度的优化算法KFAC与强化学习算法ACKTR的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于对偶学习的跨领域图片描述生成
- 下一篇: NLP 专题论文解读:从 Chatbot