“泡沫”之后,强化学习已应用到这些领域
監督學習 (Supervised Learning)、無監督學習 (Unsupervised learning) 和強化學習 (Reinforcement Learning) 是機器學習的三類算法。隨著 Alpha Go 的成功,強化學習已成為當下機器學習中最熱門的研究領域之一,逐漸在游戲、機器人控制、計算機視覺、自然語言處理和推薦系統等領域得到應用。
與常見的監督學習和非監督學習不同,強化學習主要強調智能體(Agent)與環境(Environment)的交互,其目標就是從智能體與環境的交互過程中獲取信息,學出狀態與動作之間的映射,指導智能體根據狀態做出最佳決策,最大化獲得的獎勵。
強化學習的發展不僅停留在理論層面,各大游戲、機器人、無人駕駛、金融、電商等企業在高薪招募強化學習算法工程師/研究員,爭取在技術研究及產品研發上能夠搶占先機。阿里巴巴推出的《強化學習在阿里的技術演進與業務創新》電子書籍中,全面介紹了強化學習在集團諸多業務中的成功應用。
雖然強化學習已經引起國內外足夠的關注,但中文資料少之又少,國內鮮有高校開設系統性的課程,并且缺乏相互交流的圈子。深藍學院聯合中科院自動化所、清華大學的研究人員,打磨推出『強化學習:理論與實踐』升級版I在線課程。課程通過理論與代碼實踐,讓大家掌握算法的核心思想,并安排Project大作業,體驗強化學習的實際應用;同時,建立課程答疑群,便于相互交流學習。
【講師介紹】
陳達貴,深藍學院講師,清華大學自動化系碩士,主要研究方向是深度強化學習的理論和計算圖形學,開拓了其課題組強化學習的研究方向,帶隊在FPS游戲Visual Doom人工智能競賽取得前三名。曾在阿里巴巴從事將強化學習具體落地的探索和實踐項目,具有豐富的深度強化學習實踐經驗。其主講的『強化學習理論與實踐』第一期課程,受到大家的普遍歡迎。
【課程目錄】
【報名咨詢】
1,2018年12月7日-2019年2月15日,每周五晚上7點-9點進行授課;
2,課程限報200人,報滿即止;
3,前100位,可領取100元優惠券,報名時直接抵現;
4,微信添加課程助教—書哲(shenlanflying),領券報名。
現在添加助教微信,備注“RL”,立刻免費領取RL電子資料。
總結
以上是生活随笔為你收集整理的“泡沫”之后,强化学习已应用到这些领域的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Call for Papers | 20
- 下一篇: 不用L约束又不会梯度消失的GAN,了解一