基于深度强化学习算法的A股投资分析与实证文献综述
2020-04-24 11:29:08
深度学习是人工神经网络的一个分支,具有深度网络结构的人工神经网络是深度学习最早的网络模型。
1943年,美国数学家沃尔特#183;皮茨(W.Pitts)和心理学家沃伦#183;麦克洛克(W.McCulloch)首次提出了人工神经网络这一概念,并使用数学模型对人工神经网络中的神经元进行了理论建模。
1998年,燕#183;勒存(Y. LeCun)提出了深度学习常用模型之一卷积神经网络(Convoluted Neural Network, CNN)。
2009年,Yoshua Bengio提出了深度学习另一常用模型:堆叠自动编码器(Stacked Auto-Encoder,SAE),采用自动编码器来代替深度信念网络的基本单元:限制玻尔兹曼机,来构造深度网络。
1959年,Samuel最先提出了强化学习算法后将其成功运用于国际跳棋的游戏中。
在1998年Suton提出了TD(Temporal Difference)算法,并对其理论、收敛性和实际应用进行了详细解析。
1992年,Watkins提出Q-Learing算法,并证明了算法的收敛性。
1994年Littman针对只存在两个机器之间竞争的环境,创新的提出了极小极大Q算法理论。
Hu和Wellman在文章中指出通过将纳什均衡引入到强化学习算法当中去,并开创性的提出了Nash-Q算法。
Sachiyo和Arai和Katia Sycara提出利益分配方法。