登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 理工学类 > 数学与应用数学 > 正文

基于深度强化学习算法的A股投资分析与实证文献综述

 2020-04-24 11:29:08  

深度学习是人工神经网络的一个分支,具有深度网络结构的人工神经网络是深度学习最早的网络模型。

1943年,美国数学家沃尔特#183;皮茨(W.Pitts)和心理学家沃伦#183;麦克洛克(W.McCulloch)首次提出了人工神经网络这一概念,并使用数学模型对人工神经网络中的神经元进行了理论建模。

1998年,燕#183;勒存(Y. LeCun)提出了深度学习常用模型之一卷积神经网络(Convoluted Neural Network, CNN)。

2009年,Yoshua Bengio提出了深度学习另一常用模型:堆叠自动编码器(Stacked Auto-Encoder,SAE),采用自动编码器来代替深度信念网络的基本单元:限制玻尔兹曼机,来构造深度网络。

1959年,Samuel最先提出了强化学习算法后将其成功运用于国际跳棋的游戏中。

在1998年Suton提出了TD(Temporal Difference)算法,并对其理论、收敛性和实际应用进行了详细解析。

1992年,Watkins提出Q-Learing算法,并证明了算法的收敛性。

1994年Littman针对只存在两个机器之间竞争的环境,创新的提出了极小极大Q算法理论。

Hu和Wellman在文章中指出通过将纳什均衡引入到强化学习算法当中去,并开创性的提出了Nash-Q算法。

Sachiyo和Arai和Katia Sycara提出利益分配方法。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图