贾扬清 “人工智能课程是玩游戏” 贾扬清的话被这个课实现了|资源
桃良 发自 凹非寺量子报道| QbitAI,微信官方账号学习的枯燥似乎有种魔力,让人无法提起干劲。看着我最爱的各种课程,感觉基本上逃不开吃灰的命运。除了它——可以“玩游戏”的深度强化学习课程。阿里科技副总裁贾表示:人工智能课程是玩游戏。这句话非常适合这门课!在课程中,你可以建立自己的智能体,然后教他们学会玩太空侵略者,我的世界,星际争霸,刺猬索尼克等等!
△来源:simoninithomas
怎么样?是不是心动了。然后开始你游戏代理的学习之旅。深度强化学习简介深度强化学习是一种利用深度学习技术扩展传统强化学习方法的机器学习方法。传统强化学习方法的学习内容是:智能体根据从环境中所获得的奖励,来学习如何才能够使自身获取的奖励最大化。根据从环境中获得的回报,代理人学习如何最大化自己获得的回报。
△来源:simoninithomas
而传统无模型的强化学习方法则需要使用到函数逼近方法,然后让智能体能够学习得出值函数或策略。在这种情况下,深度学习中强大的函数逼近能力显示出其优势,并被研究者所使用。于是,二者的交叉——深度强化学习就出现了。深度强化学习的标志性开端是2013年的论文《用深度强化学习玩雅达利》之后,基于深度强化学习的AlphaGo和OpenAI Five等人工智能在各类复杂游戏中相继击败了人类顶尖玩家,引起了各方的关注。此外,深度强化学习在其他领域也得到了不同程度的研究和应用,如机械手敏捷训练、室内定位、智能交通等。课程内容该课程一共分为12章:本课程分为12章:
可以看到,从DRL基础到Q-Learning,深度Q-Learning,再到策略梯度,最后是Unity机器学习代理。
作者用一个循序渐进的过程讲授了各类常见且主流的深度强化学习的方法。同时,最大的看点在于每一章都安排了不同的游戏做法。这很令人兴奋不是嘛?动手去这些游戏建立自己的智能体!去这些游戏,建立你自己的代理!
△来源:simoninithomas
对此,作者Thomas Simonini介绍道:自从2018年第一版这门课程推出以来,我们已经发布了许多新的库:TF-agent、Stable-Baseline 2.0……以及环境:MineRL、Unity ML-agent、OpenAI retro。您现在可以访问许多游戏来构建自己的代理。这就是为什么这是开始学习的最佳时机,而使用本课程,你来对地方了。这是一门从初学者到专家的免费课程,在这里你将掌握所需的技能和架构,成为强化学习的专家。关于作者托马斯·西蒙尼尼尼一位热衷于强化学习教育及其在视频游戏行业中的应用的视频游戏从业者。2016年获得法学、政治学学士学位,之后开始自学数学,深入学习,深入精读。
2017年进入Udacity学习并分别获得了深度学习、人工智能的Nano学位。2018年,他开设了深度强化学习课程,这是一个免费的开源文章和视频系列。这门课程已经成功获得了45000+的好评,每周大约有4000名读者。资源获取本课程的全部内容可以在Github中找到:https://file.jichengguandao.com/uploads/2021-11/21/zel3qhcnst0 . Wikipedia . org/wiki/% E6 % B7 % B1 % E5 % BA % A6 % E5 % BC % BA % E5 % 8C % 96% E5 % AD % A6 % E4 % B9 % A0https://medium.com/@thomassimonini/an-introduction-to-deep-reinforcement-learning-17a565999c0chttps://www.simoninithomas.com/— 完 —本文为网易新闻网易特别内容激励计划签约账号【qubit】原创内容,未经账号授权,禁止随意转载。榜单征集!7大奖项锁定AI TOP企业“2020中国人工智能年度评选”正式拉开帷幕!我们将从公司、人、产品、社区四个维度的七个奖项中搜索优秀的AI企业。欢迎扫描代码并注册参与。榜单将于12月揭晓,也期待与百万从业者们,共同见证这些优秀企业的荣誉!量子比特qbitai标题号的签名作者վ'ᴗ' ի 追踪AI技术和产品新动态原标题:“人工智能课程是在玩游戏”,贾的话被本班|资源实现了