基于LSTM的语音生成算法的研究与实现开题报告
2021-12-19 18:48:40
全文总字数:3336字
1. 研究目的与意义及国内外研究现状
(1)选题目的:对lstm和highway-lstm的原理和实现给出直观的解释,方便研究人员掌握其思想,以便进一步对算法进行改进,提出更加高效的实现方法,解决现实问题。
(2)选题意义:lstms是一种特殊的rnn,能够学习长期依赖关系,解决rnn训练深层模型随着传播深度的增加,梯度的幅度会急剧减小,会导致浅层神经元的权重更新非常缓慢,不能有效学习的缺点。基于多层lstms来训练字符级语言模型,你向它输入大量的文本,它会学习语言模型的风格,并产生类似的文本。更进一步,或许lstm模型可以学习一个人的日常习惯或者机器的操作系列特征,对人类行为进行预测,并实现人与机器操作的相关异常检测。这一项技术可以应用到很多领域,如12306火车票购票系统,可以通过基于lstm实现异常检测,以区分是人为购票还是机器软件抢票 ,检测出软件抢票的类似行为,即可通过一定方式进行限制和制止黄牛。当然还有很多其他有意思的应用,我们会致力于此项技术的研究,并解决实际问题。
国内外研究现状
近年来人工智能领域掀起了深度学习的浪潮,从学术界到工业界都热情高涨。深度学习尝试解决人工智能中抽象认知的难题,从理论分析和应用方面都获得了很大的成功。
2. 研究的基本内容
首先是理论基础学习,理解LSTM的基本概念、原理与相关应用,并剖析LSTM的代码实现。在理解LSTM的基本原理之后,剖析其在语言模型的应用和实现。在掌握LSTM实现的基础上,对算法进行一定的改进和优化,将LSTM应用到语音生成方面,并在实践的过程中,不断完善算法,致力于解决现实中的问题。
3. 实施方案、进度安排及预期效果
!--[if !supportlists]--
!--[if !supportlists]--(1) !--[endif]--实现方案:
结合多伦多大学、斯坦福大学等名校的机器学习教程和网上机器学习专家的博客以及网络上的开源代码进行理论基础的学习;对算法进行改进和优化,结合导师科研,选择一个应用进行验证;实验室已购买大型服务器,非常有助于实验的顺利进行。
!--[if !supportlists]--(2) !--[endif]--进度安排:
4. 参考文献
!--[if !supportlists]--
!--[if !supportlists]--1、!--[endif]--understanding lstm networks:http://colah.github.io/posts/2015-08-understanding-lstms/
!--[if !supportlists]--2、!--[endif]--lstm implementation:http://apaszke.github.io/lstm-explained.html
!--[if !supportlists]--3、!--[endif]--深入浅出lstm神经网络:http://www.csdn.net/article/2015-06-05/2824880