登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 任务书 > 理工学类 > 自动化 > 正文

基于强化学习的五子棋alpha-gomoku任务书

 2020-03-31 11:41:17  

1. 毕业设计(论文)主要内容:

了解五子棋和围棋alpha-go的基本规则、主流技术、学习算法现状及发展趋势。了解强化学习基本概念、值迭代、策略迭代。学习基于神经网络的估值网络CNN和策略网络ANN的双网络强化学习最优策略迭代算法并编写后端脚本。开发android前端的五子棋对弈界面并和后端脚本配合对对弈过程判断和记录。

2. 毕业设计(论文)主要任务及要求

1. 外文资料翻译不少于20000印刷符;

2. 查阅相关文献资料(至少中文15篇,英文3篇);

3. 撰写开题报告;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

第1-2周 确定选题,英文文献翻译

第3-4周 查阅文献,撰写开题报告

第5-10周 设计与实现

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

1. 赵冬斌, 邵坤, 朱圆恒,等. 深度强化学习综述:兼论计算机围棋的发展[j]. 控制理论与应用, 2016, 33(6):701-717.

2. zhao d, zhang z, dai y. self-teachingadaptive dynamic programming for gomoku[j]. neurocomputing, 2012, 78(1): 23-29.

3. 阿尔法狗原理解析http://blog.csdn.net/hereiskxm/article/details/52044089

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图