知行编程网知行编程网  2022-07-07 19:00 知行编程网 隐藏边栏 |   抢沙发  10 
文章评分 0 次,平均分 0.0

妙啊,边玩游戏边学强化学习

桃良 发自 凹非寺 
来自 | 量子位

学习的枯燥似乎有种魔力,让人无法提起干劲。

看着我收藏夹里的各类课程,感觉基本上都难逃吃灰的命运,

除了它——可以“玩游戏”的深度强化学习课程。

阿里技术副总裁贾扬清说过:

人工智能课程是玩游戏。

这话对之于这个课程简直再合适不过了!

在课程中,你可以建立自己的智能体,然后教他们学会玩太空侵略者,我的世界,星际争霸,刺猬索尼克等等!       

妙啊,边玩游戏边学强化学习

图源:simoninithomas

怎么样?是不是心动了。

那就开始你的游戏智能体的学习之旅吧。

   深度强化学习简介

深度强化学习 (DRL) 是一种使用深度学习技术去扩展传统强化学习方法的一种机器学习方法。

传统强化学习方法的学习内容是:

智能体根据从环境中所获得的奖励,来学习如何才能够使自身获取的奖励最大化。


妙啊,边玩游戏边学强化学习


图源:simoninithomas

而传统无模型的强化学习方法则需要使用到函数逼近方法,然后让智能体能够学习得出值函数或策略。

在这种情况下,深度学习中强大的函数逼近能力便显示出他的优势并开始被研究人员所使用。

于是,二者的交叉——深度强化学习就出现了。

深度强化学习的标志性开端是2013年的论文——《Playing Atari with Deep Reinforcement Learning》

之后,基于深度强化学习的AlphaGo和OpenAI Five等人工智能在各类复杂游戏中相继击败了人类顶尖玩家,引起了各方的关注。

此外,深度强化学习在其他领域也有着不同程度的研究和应用,比如:机械手的敏捷训练、室内定位、智能运输等。

   课程内容

该课程一共分为12章:

妙啊,边玩游戏边学强化学习

可以看出,从DRL基础(1),再到Q-Learning、深度Q-Learning(2-4),然后是策略梯度(5-8),最后是Unity机器学习智能体(10-12)。

作者用一个循序渐进的过程讲授了各类常见且主流的深度强化学习的方法。

同时,最大的吸引点莫过于是每一章节都安排了不同的游戏实践。

这很令人兴奋不是嘛?

动手去这些游戏建立自己的智能体!

妙啊,边玩游戏边学强化学习

图源:simoninithomas

对此,作者Thomas Simonini介绍道:

自2018年推出该课程的第一版以来,我们发布了许多新库:TF-Agents、Stable-Baseline 2.0…和环境:MineRL(Minecraft)、Unity ML-Agents、OpenAI retro(NES、SNES、MD游戏机里的游戏…)。您现在可以访问许多游戏来建立自己的智能体。

这就是为什么这是开始学习的最佳时机,而使用本课程,你来对地方了。

这是一门从初学者到专家的免费课程,在这里您将掌握所需的技能和体系结构,从而成为深度强化学习专家。


   关于作者

Thomas Simonini

一位热衷于强化学习(RL)教育及其在视频游戏行业中的应用的视频游戏从业者。

妙啊,边玩游戏边学强化学习

2016年获得法律和政治科学学士学位,之后开始自学数学、深度学习和深度强化学习等相关课程。

2017年进入Udacity学习并分别获得了深度学习、人工智能的Nano学位。

2018年,他开设了深度强化学习课程,这是一个免费的开源文章和视频系列。这门课程成功收获了45,000+的点赞,每周约有4,000名阅读量。

   资源获取

该课程的完整内容见于Github:

https://simoninithomas.github.io/deep-rl-course/#syllabus

该作者在Youtube上的个人账号:

https://www.youtube.com/c/thomassimonini?sub_confirmation=1


参考链接:
https://simoninithomas.github.io/deep-rl-course/#syllabus
https://zh.wikipedia.org/wiki/%E6%B7%B1%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0
https://medium.com/@thomassimonini/an-introduction-to-deep-reinforcement-learning-17a565999c0c
https://www.simoninithomas.com/


<section data-brushtype="text" style="padding-right: 0em;padding-left: 0em;white-space: normal;max-width: 100%;letter-spacing: 0.544px;color: rgb(62, 62, 62);font-family: "Helvetica Neue", Helvetica, "Hiragino Sans GB", "Microsoft YaHei", Arial, sans-serif;widows: 1;word-spacing: 2px;caret-color: rgb(255, 0, 0);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;color: rgb(0, 0, 0);font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong>完<strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;font-size: 14px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-size: 16px;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;letter-spacing: 0.5px;box-sizing: border-box !important;overflow-wrap: break-word !important;">—</span></strong></span></strong></span></strong></section><pre style="padding-right: 0em;padding-left: 0em;max-width: 100%;letter-spacing: 0.544px;color: rgb(62, 62, 62);widows: 1;word-spacing: 2px;caret-color: rgb(255, 0, 0);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><pre style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-bottom: 15px;padding-right: 0em;padding-left: 0em;max-width: 100%;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(0, 0, 0);box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;font-family: 微软雅黑;caret-color: red;box-sizing: border-box !important;overflow-wrap: break-word !important;">为您推荐</span></strong></span></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;">一文了解深度推荐算法的演进</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;">干货 | 算法工程师超实用技术路线图</section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 14px;">13个算法工程师必须掌握的PyTorch Tricks</span></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 14px;">吴恩达上新:生成对抗网络(GAN)专项课程</span><br  /></section><section style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;box-sizing: border-box !important;overflow-wrap: break-word !important;">拿到2021灰飞烟灭算法岗offer的大佬们是啥样的<span style="font-size: 14px;">?</span></section></section></section></section></section></section></section></section></section>

妙啊,边玩游戏边学强化学习

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享