基于微信公众号的聊天机器人技术研究毕业论文
2020-04-12 08:43:15
摘 要
本文主要研究现在互联网上主流的聊天机器人的现状以及一些聊天机器人的实现方法及制作原理,聊天机器人在市场上的应用以及在人们生活上中的应用,本文在前半部分将简单介绍聊天机器人的发展历史,以及人工智能的发展过程,其中着重介绍聊天机器人的发展历史及发展过程,以及介绍聊天机器人的种类以及各种聊天机器人的实现方法以及应用场景的解析,本文在文章后半部分将对基于Tensonflow框架实现基于深度学习的聊天机器人的实现及原理做一定的解析,最后在介绍一下如何将聊天机器人接入微信公众号,
论文主要研究了聊天机器人的核心技术以及实现方法,例如对于深度学习的神经网络的模型的研究,RNN和LSTM模型的比较,基于知识图谱的聊天机器人的研究。
研究结果表明:当今微信上使用的聊天机器人多数是基于深度学习的神经网络的,服务号上的查询服务等是基于多任务流程式的聊天智能机器人。
本文的特色:本文主要介绍了各种聊天机器人的原理及实现方法,以及如何将聊天机器人接入微信。
关键词:机器学习;深度学习;聊天机器人
Abstract
This paper mainly studies the current status of the mainstream chat bots on the Internet, as well as the implementation methods and production principles of some chat bots, the application of chat bots in the market and their applications in people's lives. This article will briefly introduce the development of chat bots in the first half of this article. History and the development process of artificial intelligence, which focuses on the development history and development process of chatbots, as well as the types of chatbots as well as the implementation methods of various chatbots and the analysis of application scenarios. This article will be based on the latter part of the article. The Tensonflow framework implements a certain analysis of the implementation and principle of the chat robot based on deep learning, and finally introduces how to connect the chat robot to the WeChat public account.
The dissertation mainly studies the core technology and implementation methods of chat robots, such as the research of neural network models for deep learning, the comparison of RNN and LSTM models, and the research of chat robots based on knowledge maps.
The research results show that most of the chat bots used on WeChat today are based on deep learning neural networks, and the query service on the service number is based on a multi-task process chat intelligent robot.
The characteristics of this article: This article mainly introduces the principles and implementation methods of various chat robots, and how to connect chatbots to WeChat.
Keywords:machine learning;deep learning;chatbot;
目 录
第一章 绪论 6
1.1 聊天机器人的历史 6
1.2智能聊天机器人体系结构 7
1.3智能聊天机器人的分类标准 9
第二章 聊天机器人的技术简介 10
2.1 AIML简介 10
2.1.1 AIML基本元素 10
2.2 AIML智能聊天机器人技术 11
2.3 基于深度学习的聊天机器人的技术研究 13
2.3.1 循环神经网络 13
2.3.2 门控循环单元(GRU) 15
2.3.3 长短期记忆模型(LSTM) 16
2.4 Seq2seq模型简介 17
第三章 微信公众号的开发 20
3.1 微信公众号简介 20
3.1.1 如何处理GET请求 21
3.1.2 微信数据传输流程 21
3.2 基于Python的微信公众号接口 22
第四章 成果测试及分析 23
4.1 基于AIML人工智能标记语言的ALICE成果演示 23
4.2 基于Seq2seq原理的成果展示 25
4.3 微信公众号聊天机器人测试 26
4.4 聊天机器人的优势与发展前景 27
第五章 总结 28
参考文献 29
致谢 30
第一章 绪论
典型的对于聊天机器人的定义是一个计算机的程序,这个程序可以处理自然语言的输入并且将生成一个智能的相关的答案。目前,聊天机器人由规则驱动引擎或人工智能(AI)引擎驱动,主要通过基于文本的界面与用户交互。独立的计算机程序,可以插入任何一种社交平台中的,这些社交平台已通过诸如Facebook Messenger,wechat,Skype,Microsoft Teams等API向开发人员开放[1]。对于开发人员来说,聊天机器人的开发已经成为先当今比较火热的项目,劳动力成本的提高让许多企业不得不向技术层面寻求节省资金的方法,移动电话的自助服务热线已经从人工转变为了自助聊天软件,这为智能聊天软件的开发提供了一个有利的原动力,推动智能聊天机器人的发展,本文将结合微信公众号的聊天机器人,来浅谈聊天机器人的发展趋势以及主要的技术实现等等。
聊天机器人的历史
通过查看聊天机器人的历史,开始聊天机器人的旅程。 作为一种媒介的聊天机器人已经存在,从计算机已经存在并且已经成为过去几十年中最重要的通信媒介之一。 在本章的这一节中,我将介绍聊天机器人的起源以及早期的计算机科学家如何以自然的方式使计算机与人交谈。我们还将介绍当前行业的发展情况,这些发展趋势正在促进当今大规模的聊天机器人的可用性。为了更好地理解聊天机器人的历史发展,请参见图1-1。
尽管聊天机器人似乎是最近才流行起来的,但是他们早已出现自从人们发明了一种方式去与计算机交流,最早的第一代聊天机器人甚至比第一台电脑的出现还要早,最早的聊天机器人叫Eliza由麻省理工学院人工智能实验室的Joseph Weizenbaum于1966年发明,Eliza被人性化为一名心理治疗师[2]。Eliza的主要技术就是检查用户输入的关键字然后触发输出规则,这种特殊的生成回复的方法现在仍然广泛的使用在制作聊天机器人中,在Eliza之后,心理医生Kenneth Colby制作了Parry,企图模拟一个有偏执精神分裂症的病人
Alice机器人最初由Richard Wallace在1995年受Eliza的启发发明的,尽管她没能通过图灵测试(如果有超过30%的测试者不能确定出被测试者是人还是机器),但是她仍然是聊天机器人中最强大的一个并且被三次授予罗布纳奖。
在21世纪的第一个10年里,ActiveBuddy创建了Smarterchild,这是它第一次尝试去创造一个聊天机器人不仅仅能够去提供娱乐项目并且能够给用户提供有用的信息例如股票信息,体育比赛的得分,电影语录等等,之后苹果公司推出了SIRI用于IOS5及以上系统,到现在的声音驱动聊天机器人如亚马逊的Alexa和Google Home等
图 1-1 聊天机器人发展历史
1.2智能聊天机器人体系结构
智能聊天机器人的体系结构可以从四个模块进行分析,当人们与智能聊天机器人对话时,可以通过两种方式进行输入,一种是通过声音的方式,一种是通过文字的方式。机器人得到输入之后,要进行语音识别或者文字识别,语音识别既要包括语音的采集,又要包括从声音信号转化为文字信号的步骤,紧接着的是语义理解部分,如何让机器人理解你说的内容呢?机器人会将得到的文字信号经过中文分词,词性标注,实体意图的识别,语义分析等等方法,机器人进行语义处理之后,会把相应的内容送往对话管理部分,对话管理一是对对话状态跟踪,二是对对话活动进行决策,当完成对话状态跟踪和对话活动的决策时,会生成对应的答案,这种答案往往是两种情况,一种是多答案的情况,第二种是多处理模式的选择,在机器人的答案选择中,往往要进行多种选择,这时机器人要进行决策,如果是找到了多种答案,机器人要在这多种答案中进行选择,这就要涉及到决策模型,决策模型包括通用的决策模型和领域的决策模型,通用的决策模型可以理解为适合于所有领域的决策模块,领域模型对应的为特定领域,比如教育、医疗、房产等领域。这其中我们需要注意的是,当人的话述传入到对话管理组件之后,这时会存在几种情况,一种情况是发出信号的人他所传递的语料信息可以在对话库中可以直接找到答案,这时又分成了找到一个答案和找到多个答案两种场景,第二种情况是找不到答案,在找不到答案时机器人如何处理呢?这是涉及到两种方法,第一是优先级,第二是补位。优先级是指用户的话进行语义理解以后,如果在备选语料库中有多个答案的情况下,优先采取的答案按照优先级的高低来决策,第二种是在语料库中找不到答案的时候,可选的策略是什么,这时就会进行补位,补位的方式主要有知识图谱,搜索引擎,百科类问答等。机器人将得到的答案进行合成,在转换成声音信号。
图1.2,聊天机器人的体系结构
针对智能语音,分为语音识别和语音合成两大部分。语音识别是将人类的语音词汇内容转换为计算机可读的输入,语音合成是通过机械的、电子的方法产生人造语音的技术,语音识别涉及到孤立词语音识别、连续词语音识别以及大词表连续语音识别,语音合成技术包括,语言处理、声学处理、韵律处理以及情感处理等等,当我们听到现在有些机器人发出的声音非常的机械化,是说明在这些技术的处理方面很难达到一个拟人化的水平,
在自然语言处理方面,包括语义理解和语言生成两大部分,语义理解涵盖了中文分词、序列标注、实体识别、意图识别等等方法,语言的生成方面,有预定义的模板,问答语料库、知识图谱、深度学习(seq2seq)的生成方式,其中前三种方法为人工搭建,不难想到它们是有瓶颈的,而基于深度学习的(seq2seq)方式,生成的效果不够理想,很难达到人们要求的水平。
以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。
相关图片展示: