基于深度学习的智能语音聊天系统的设计与研究开题报告
2020-02-18 19:23:43
1. 研究目的与意义(文献综述)
随着人工智能的发展,最近几年出现了很多人工智能机器人,在各行各业中都有人工智能的应用,而人工智能的高速发展给我们的生活带来了很大的便利,随着生活质量的提升,人们开始研究用自然语言与计算机的交流,于是智能聊天系统便得到了广大的市场。智能聊天系统通过机器学习,学习自然语言然后来与人类进行对话,它不仅可以回答人类的问题,还可以与人类进行一些简单的对话。
对话系统,也称为交互式会话对象,虚拟代理,有时是聊天机器人,用于从技术支持服务到语言学习工具和娱乐的广泛应用。对话系统可以分为目标驱动系统,如技术支持服务,以及非目标驱动系统,如语言学习工具或计算机游戏角色。而智能对话系统就是无目标驱动系统,这种无目标驱动的对话系统就是开放式领域的智能聊天系统。
其实人工智能的历史已经有了60年,机器人也存在了数十年,但是20世纪90年代以前的聊天系统与用户的谈话仅仅基于谈话技巧和程序技巧,他们都是检索式聊天系统,就是他们的对话库中放着很多对话模板和句型,在当人们问到问题时在对话库中检索匹配的答案。但是这样的聊天系统有很大的缺陷,第一就是需要一个非常大的对话库,因为它在进行对话的时候是根据问题来对话库中找相应的答案,一个需要概括所有问题的对话库是相当庞大的,非常不容易建立。第二就是这样的对话系统缺乏语义分析能力,只是单纯的对问题寻找答案,缺乏对问题的思考,无法对上下文进行思考,就无法得出富有“情商”的回答,对话质量差强人意。因此我们要追求生成式的智能聊天系统,能够根据上下文来理解问题,然后给出富有人类“情商”的回答。
2. 研究的基本内容与方案
本文研究内容为基于深度学习的智能语音聊天系统的设计,学会通过google开源的编程系统tensorflow进行深度学习,来实现一个生成式的智能聊天系统,可以获取主题信息,根据上下文给出更好的回复。
智能语音聊天系统框架分为五个模块,分别为:1、输入预处理模块,2、自然语言理解模块,3、对话管理模块,4、答案生成模块,5、输出处理模块。总流程为: 首先用户输入文字或者语音信息,然后进行预处理,转化成机器语言进行自然语言理解,然后通过上下文进行对话管理,然后对当前对话模型提取答案,最后将生成的回复文本进行合成输出给用户。系统框图如下图(见附件)
输入预处理模块中,如果是文本输入,就直接将文本信息交给自然语言理解模块,如果是语音输入,就要讲语音信号转为文本信息交给自然语音理解模块。自然语言理解模块主要负责从完整的语句中提取出需要的信息,并且理解用户输入问句的语义,产生一个特定的语义表达式。还需要句法分析,词义消歧和相似度计算等。本系统使用基于lstm的encoder-decoder模型,encoder端和decoder端都是用lstm单元,其利用给定的对话历史信息(原句或者问题),生成一个最大可能性的响应信息(回复),并且加入attention机制提高模型生成效果。生成与训练词向量使用word embedding技术和它的训练工具word2vec,其中最重要的两个模型就是cbow模型和skip-gram模型。训练词向量方面首先获取语料库,然后使用分词工具对语料库进行分词,然后采用distributed representation分布式表达方法产生词向量。句法分析方面使用概率上下文无关法,词语消歧方面使用基于贝叶斯分类器方法消歧。生成式聊天系统使用encoder-decoder框架,学习从源语言到目标语言的关系。
3. 研究计划与安排
第1-4周:查阅相关中、英文文献资料,明确研究内容。确定设计方案,完成开题报告,完成不少于2万字符的英文翻译任务;
第5-6周:完成论文开题工作。
第7-10周:完成智能语音聊天系统的构建,并撰写部分论文初稿;
4. 参考文献(12篇以上)
[1]孙立茹,余华云,基于深度学习的生成式聊天机器人算法综述[j].电脑知识与技术,2018,23:227-228
[2]王浩畅,李斌等.聊天机器人系统研究进展[j].计算机应用与软件,2018,12:83-89
[3]程洁.智能聊天机器人:对话未来[j].科技经济导刊,2018,02:14-15