基于强化学习的机器人路径规划算法研究开题报告
2020-04-13 17:08:39
1. 研究目的与意义(文献综述)
1.1研究目的及意义
随着alphago的大火,人工智能与机器学习概念逐渐流行起来,并被高度期待为未来几十年新的技科技革命推动点,世界各科技强国和组织争相在此领域布局意图占领新科技制高点。强化学习作为机器学习的一个重要方向,越来越受到重视,它是区别于传统监督式学习和非监督式学习的另外一种学习算法类别,基本特点是利用试错的方法通过学习者与环境的交互过程中获得的环境反馈的评价性信号不断调整自身行为实现序列(sequential)决策的优化。强化学习由于不需要明确给定各种状态下的教师信号,故可以在对环境一无所知的情况下通过经验的积累完成决策,在求解复杂的优化决策问题中具有广阔的应用前景。其一个重要的应用领域便是移动机器人在未知环境里的避障与路线选择[1]。
2. 研究的基本内容与方案
2.1 目标(开发的系统概况描述)
3. 研究计划与安排
1. 2018/1/14—2018/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;
2. 2018/3/1—2018/4/30:系统架构、程序设计与开发、系统测试与完善;
3. 2018/5/1—2018/5/25:撰写及修改毕业论文;
4. 2018/5/26—2018/6/6:准备答辩。
4. 参考文献(12篇以上)
[1] 徐明亮. 强化学习及其应用研究[d]. 无锡:江南大学,2010:1-88.
[2] 杜小勤. 强化学习中状态抽象技术的研究[d]. 武汉:华中科技大学,2007:1-123.