基于强化学习的五子棋alpha-gomoku任务书
2020-03-31 11:41:17
1. 毕业设计(论文)主要内容:
了解五子棋和围棋alpha-go的基本规则、主流技术、学习算法现状及发展趋势。了解强化学习基本概念、值迭代、策略迭代。学习基于神经网络的估值网络CNN和策略网络ANN的双网络强化学习最优策略迭代算法并编写后端脚本。开发android前端的五子棋对弈界面并和后端脚本配合对对弈过程判断和记录。
2. 毕业设计(论文)主要任务及要求
1. 外文资料翻译不少于20000印刷符;
2. 查阅相关文献资料(至少中文15篇,英文3篇);
3. 撰写开题报告;
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
3. 毕业设计(论文)完成任务的计划与安排
第1-2周 确定选题,英文文献翻译
第3-4周 查阅文献,撰写开题报告
第5-10周 设计与实现
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!
4. 主要参考文献
1. 赵冬斌, 邵坤, 朱圆恒,等. 深度强化学习综述:兼论计算机围棋的发展[j]. 控制理论与应用, 2016, 33(6):701-717.
2. zhao d, zhang z, dai y. self-teachingadaptive dynamic programming for gomoku[j]. neurocomputing, 2012, 78(1): 23-29.
3. 阿尔法狗原理解析http://blog.csdn.net/hereiskxm/article/details/52044089
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付