课题组第二届RLchina强化学习夏令营学习

课题组第二届RLchina强化学习夏令营学习

在2021年8月16日至2021年8月22日期间,TSMC(可信软件与移动计算实验室)强化学习小组20级与21级研究生同学共同参加了由Rlchina举行的强化学习夏令营,这是继去年以来参加的第二次Rlchina暑期夏令营。实验室同学顺利通过五次课程考试并取得此次强化学习夏令营的结课证书:

RLChina暑期课是由伦敦大学教授汪军老师发起,所有参与教师共同分享给广大强化学习爱好者的免费网络直播课程。今年,RLChina暑期课全新升级,20位来自全球顶级高校和企业的强化学习专家共同为大家讲解从入门到前沿的强化学习知识,此外还准备了习题课、智能体竞赛日、决策智能创业日帮助大家全方位地接触强化学习落地实践。

 (图片来源rlchina.org)

另外此次夏令营,中国科学院自动化研究所群体决策智能实验室(CASIA)提供了具有丰富博弈环境和当前RL领域前沿的开源算法的智能体竞赛平台:及第AI(http://www.jidiai.cn/)

这里涵盖着大部分常见的环境demo,例如推箱子、车杆、五子棋等单智能环境还有多人贪吃蛇、合作推箱子、足球11v11等多智能体环境。

(图片来源jidiai.cn)

平台也提供着一些开源算法,例如:DQN、DDQN、PG、PPO等单智能算法,还有MADDPG\IQL多智能体算法。

此次RLchina的暑期夏令营活动更加注重强化学习的实践能力,同时也让学习强化学习算法的同学意识到强化学习与深度强化学习的学术前沿方向。其中的难题是如何将强化学习进行应用的落地问题,期待强化学习在不久的将来更加趋于普遍化、工程化。

 

关于我们

TSMC实验室隶属于大连海事大学信息科学技术学院,位于大连海事大学西山校区扬帆楼,总部在601室。实验室秉承“进取、思辨、实践、效率”的个人价值观,不断发展“团队、合作、沟通”的精神理念,大家一起工作和学习,互为人师,共享知识和经验。作为一个积极活跃的研究组,TSMC每周都在扬帆楼304组织讨论有意思的期刊、会议论文、系统及工具等。实践是最好的成长平台,学生尽早进入实验室,或者参加TSMC开放日活动,不但使自己感受到TSMC科研氛围,还可加深对专业研究方向的了解,提前做好职业生涯的长期规划。 

 

 



标签


最新文章