基于自适应共振理论和强化学习的避障算法研究任务书
2020-02-18 17:25:16
1. 毕业设计(论文)主要内容:
研究无监督学习的各种技术,尤其是自适应共振理论;研究强化学习的各种技术,包括Q-learning算法、确定性策略梯度算法、Actor-Critic框架及深度确定性策略梯度算法。针对DDPG模型在避障应用中存在的泛化性能不高等缺陷,将自适应共振理论与强化学习技术相结合,在保证移动智能体避障性能的同时,提出一种算法可以优化深度确定性策略梯度(DDPG)算法的泛化性能等能力。自主设计仿真环境或者利用成熟的仿真环境对测试提出算法的有效性并分析相关的性能指标。
2. 毕业设计(论文)主要任务及要求
1)首先采集相关数据集,对其进行分析;
2)然后搜集相关资料,采用一种改进的神经网络对数据集进行训练,并对模型进行评估和改进;
3)最后测试环境感知及路径规划下的避障功能;
3. 毕业设计(论文)完成任务的计划与安排
1)2019/1/14—2019/1/22:查阅参考文献,明确选题;
2)2019/1/23—2019/2/22:进一步阅读文献,完成开题报告;翻译英文资料(不少于5000汉字),并交予指导教师检查。
3)2019/2/23—2019/4/30:对采集的相关数据集进行分析;模型的建立与改进;空间结构感知及避障系统实现。
4. 主要参考文献
[1] 周志华. 机器学习. 清华大学出版社,2016
[2] 郑欣.基于半监督和无监督学习的特征选择算法研究[d].西安:西北大学,2017.
[3] 王志强.基于局部中心亮度的聚类算法研究[d].广州:华南理工大学,2018.