基于强化学习的五子棋alpha-gomoku任务书

2020-03-31 11:41:17

1. 毕业设计（论文）主要内容：

了解五子棋和围棋alpha-go的基本规则、主流技术、学习算法现状及发展趋势。了解强化学习基本概念、值迭代、策略迭代。学习基于神经网络的估值网络CNN和策略网络ANN的双网络强化学习最优策略迭代算法并编写后端脚本。开发android前端的五子棋对弈界面并和后端脚本配合对对弈过程判断和记录。

1. 外文资料翻译不少于20000印刷符；

2. 查阅相关文献资料（至少中文15篇，英文3篇）；

3. 撰写开题报告；

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

第1-2周确定选题，英文文献翻译

第3-4周查阅文献，撰写开题报告

第5-10周设计与实现

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

1. 赵冬斌, 邵坤, 朱圆恒,等. 深度强化学习综述:兼论计算机围棋的发展[j]. 控制理论与应用, 2016, 33(6):701-717.

2. zhao d, zhang z, dai y. self-teachingadaptive dynamic programming for gomoku[j]. neurocomputing, 2012, 78(1): 23-29.

3. 阿尔法狗原理解析http://blog.csdn.net/hereiskxm/article/details/52044089

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付