基于强化学习的机器人路径规划算法研究任务书
2020-04-13 11:42:40
1. 毕业设计(论文)主要内容:
强化学习在 alphago 上大获成功之后变得越来越流行。强化学习是不同于机器学习中其它两大类学习方法-监督学习和非监督学习),其基本思想是借鉴人类学习的过程,让agent(智能体,或称学习体)通过不断试错来找寻最优策略,而我们只需要设置回报(奖励和惩罚)即可。
随着移动机器人技术的飞速发展,应用于未知环境下的移动机器人路径规划技术得到了越来越多专家的关注与研究。强化学习是一种重要的机器学习方法,通过不断试错与环境交互寻找最优策略。 针对未知环境下的移动机器人路径规划问题,设计一种基于某种策略选择的q-学习算法。该方法能够使得机器人根据运动过程中周围的环境信息,找到一条更加优化的类人行走路径,提高机器人路径规划的成功率。
2. 毕业设计(论文)主要任务及要求
1.查阅15篇相关文献(含2篇外文),并每篇书写200—300字文献摘要(装订成册,带封面);
2.认真填写周记,完成800字开题报告;
3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);
4.完成系统的编码与调试;
5.完成10000字以上的毕业论文;
6.进行论文答辩。
3. 毕业设计(论文)完成任务的计划与安排
1. 2018/1/14—2018/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
2. 2018/3/1—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
3. 2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 2018/5/26—2018/6/6:准备答辩。
4. 主要参考文献
[1] martinez-gil f, lozano m, fernández f. marl-ped: a multi-agent reinforcement learning based framework to simulate pedestrian groups[j]. simulation modelling practice and theory, 2014, 47: 259-275.
[2] r.s. sutton, a.g. barto, reinforcement learning: an introduction, mit press, cambridge, ma, 1998.
[3]徐明亮.强化学习及其应用研究[d]. 江南大学 2010.