登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 软件工程 > 正文

面向Simple Question的自动问答方法研究文献综述

 2020-04-14 19:58:53  

1.目的及意义

问答系统作为下一代搜索引擎的基本形态,受到越来越多的关注与研究。人们在日常生活中遇到的大多数问题都可以通过问答系统来回答。例如百度,谷歌等搜索引擎,会根据用户输入的问题提供答案列表以供选择。而基于单一事实回答问题的问答系统也受到更多学者的青睐。在基于单事实问题问答机制下,可以充分利用大规模知识库的优势,为人们提供快速的问答服务。事实上,如果知识库被合理组织,简单问答系统本身的任务可能包含广泛的实际用途,作为更多先进的,能解决更复杂问题的神经问答方法的未来开发基础。

随着人们对精神需求的不断提高,问答系统拥有越来越广阔的应用前景。例如,问答系统可以用于淘宝,微博等各个软件的虚拟客服,针对用户输入的自然语言问题,使用问答系统给出最符合问题的最佳答案,非常灵活方便,节约时间。其次,问答系统还可以用于各种教育辅助软件,相当于电子百科全书,用户可以通过这些软件及时准确地解决生活中各种各样的疑惑,方便快捷。然而,尽管做了大量的研究工作,问答仍是一个挑战。甚至在研究充分的领域,例如用英语的一般领域的事实问题,现有的方法很难匹配人类对问题的理解。英语以外的语言以及法律或生物医学数据等专业领域,带来了额外的挑战,使这项任务更加困难。

国外对简单问答系统的研究始于20世纪60年代[9],经过50多年的发展,已取得了大量的研究成果。虽然,在文本文件或在网上搜索,并从中提取精确答案的问答系统有很长的历史,但最近的进展来自于大型知识库(Knowledge Bases, KBS)例如FreeBase的发布。基于知识库问答的现存方法,或者使用可学习的组件,或者将问题转换成一个结构化知识库查询,或者学习将问题和事实镶嵌进一个低维向量空间,(Bordes et al. 2014)[2]通过计算相似度检索答案。最近的研究集中在设计拥有更高推理能力的系统,这种方法检索和使用多样的事实来回答问题,然而,简单问题,即能够通过提取单个事实来回答,组成了网络上问题的一大部分,仍给问答系统带来挑战。首先,现存的基准很小;他们大多数覆盖事实的主要部分,并且被限制在他们的问题类型、语法和词法的变化中。其次,现有的系统在少数小基准数据集的特定问题模板的范围外表现如何仍然是未知的,在一个单独的数据集上学习是否能很好地转移到其他数据集上也是未知的,并且这样的系统是否能够从不同的训练源学习也是未知的。尤其是是面对大量的知识资源时。现有的问答系统通常依赖于各种组件,每个组件专门用于解决问题的不同子任务(例如分裂,实体识别,消除歧义,和关系分类等)。总之,对于单事实问题(即简单问题),挑战仍然很大。国内对问答系统的研究开始于20世纪90年代,虽然起步较晚,但是同样取得了令人瞩目的成就,涉及领域甚广,与人们的生活也越来越贴近。

单事实(即简单问题)问答系统的最主要的特点在于:1)用户输入的是自然语言的问句;2)返回答案不再是文档排序的形态,而是直接给出用户所需的答案。这需要对用户自然语言问句进行深度理解, 同时对网页中的目标文本进行细致的语义分析, 从中抽取出知识,并根据用户的问题准确匹配、推理相对应的答案。

本文的目的为利用深度学习技术来研究基于知识库的单关系问题的问答方法。在本文中,我们将使用RNN、LSTM、GRU等循环神经网络,实现实体、关系和问题文本的多层次的表示学习,将其转换为低维语义空间中的数值向量,再将识别出的实体和关系映射到知识库对应的三元组,在这个过程中,我们将利用分层单词和字符级问题编码器,结合字符级模型的OOV优势和单词级模型丰富的语义,使用训练和预测提高来生成答案。在这里我们我们研究使用类型信息来更好地消除主语歧义,并添加注意机制。然后,采用不同的负样本技术分析结果,并对实验结果做误差分析,探究更加高效的实体和关系候选集的构造和修剪方法,构建高效的端到端的自动问答方法。

{title}

2. 研究的基本内容与方案

{title}

基本内容:

  1. 针对简单问题,同时使用字符级和单词级两种嵌入式技术分别对实体、关系、问题进行建模,得到实体候选集和关系候选集,通过神经网络选择分别返回与问题最匹配的主语和谓语,与知识库中的事实进行匹配得到答案。

  2. 研究负采样技术,采取不同的负采样技术计算相似度,采取正负样本,并对负样本进行统计分析,训练和修剪,挑选负样本进行误差分析。

    目标:

    剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图