基于强化学习的坦克大战对弈策略设计与实现任务书
2020-02-18 17:30:55
1. 毕业设计(论文)主要内容:
强化学习(Reinforcement learning)是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。
坦克大战是一款经典的平面射击游戏,游戏以坦克战斗及保卫基地为主题,属于策略型联机类。本研究以坦克大战游戏为背景,致力于设计出一个基于强化学习的坦克大战人机对弈策略。
2. 毕业设计(论文)主要任务及要求
(1) 基于强化学习的坦克大战策略的设计:
设计并实现基于安卓的坦克大战app,具体功能为:玩家和ai坦克可以在地图上进行移动、射击,击败敌方坦克获得积分。在此基础上,设计并实现基于强化学习的坦克大战人机对弈策略。
(2) 技术要求:
3. 毕业设计(论文)完成任务的计划与安排
2019年1月11日-2019年1月31日:阅读文献,主要是安卓应用开发和强化学习相关文献;
2019年2月1日-2019年2月28日:掌握技能,具有针对性的学习编程语言,算法,强化学习相关知识,尝试实现已阅读文献中的方法,完成开题报告;
2019年3月1日-2019年3月31日:设计基于安卓的坦克大战应用,并进行调试;
4. 主要参考文献
[1] 李瑞奇. android 开发实战: 从学习到产品[m]. 清華大學出版社, 2018.
[2] sutton r s, barto a g. reinforcement learning: an introduction[m]. mit press, 2018.
[3] spronck p, ponsen m, sprinkhuizen-kuyper i, et al. adaptive game ai with dynamic scripting[j]. machine learning, 2006, 63(3): 217-248.