登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 电子信息工程 > 正文

基于深度学习的问题分类研究开题报告

 2020-02-18 16:20:20  

1. 研究目的与意义(文献综述)

随着计算机及互联网络技术的发展,开放域问答系统越来越受到人们的关注,因为它能够给用户提供相对简洁、准确的结果。问答系统不似传统的信息检索系统,信息检索系统是根据用户指定的一些关键词,系统返回与之相关的文档,用户必须查看文档才能发现所需的答案,信息检索系统主要利用文档中词汇的统计信息。

开放域问答系统通常包括问题分析、信息检索、答案抽取三个主要部分。问题理解是问答系统处理用户输入的第一步,问题分类就是问题理解步骤中的关键一环,问题分类是指根据问题所对应的答案类型来将问题分为不同的类别。问题分类提供了候选答案中需要进行下一步精确定位和验证处理的答案类型的约束,其次,问题分类提供后续过程中可能用于决定采取何种答案选择策略的信息。问题分类准确性将直接影响到问答系统后续多种策略的制定,最终影响抽取的答案的准确性,因此问题分类成为自动问答系统研究中的基础任务。问答系统允许用户以自然语言进行提问,并返回给用户精确的回答。随着语义分析等自然语言处理技术、大数据等相关技术的发展,在智能客服等实际应用的需求之下,问答系统成为一个研究热点。

问题分类是问答系统的重要环节,单独研究问题分类意义不大,问题分类不是作为一个单独、独立的问题提出来的,它作为自动问答系统的一个重要的子模块,备受广大学者和大众的关注。随着人工智能和自然语言处理等相关技术的发展,问答系统也衍生出许多不同种类。传统的机器学习分类方法:首先对数据进行获取及预处理,对数据进行测量、采样、量化,将其描述为矩阵、向量等机器能够识别的形式,但是中文不像英文,词与词之间没有分隔符,所以中文问句还要进行分词处理;然后是特征提取与选择:特征选择要选择对分类贡献最大的特征项,作为句子的特征向量,并将其作为分类器的输入;再是构建分类器:中文问句分类思想最初借鉴于英文问句分类,后来提出贝叶斯、svm(支持向量机)、决策树等主流机器学习方法;最后是性能评估分析分类器标注结果,评价准确率。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

2.1基本内容

本课题的设计内容是运用人工神经网络,充分利用深度学习自动化的提取特征的优势,来得到一个较好的结果。最后利用提出的算法,开发一个问题分类系统,使得分类结果能在人物、地点、数字、时间、实体、描述、未知七个大类中取得较好的结果,便于问答系统后续的答案检索与抽取。需解决的问题:

首先是需要对中文文本进行预处理,主要包括分词以及去停用词。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1-3周:调研,完成开题报告。

4周:熟悉python语言和编程基本技能。

5周:了解传统机器学习分类算法。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 李超,柴玉梅,南晓斐,等.基于深度学习的问题分类方法研究[j] .计算机科学,2016,43(12):115-119.

[2] 周志华.机器学习:=machine learning[m] .清华大学出版社,2016.

[3] 叶得学.中文问答系统中问题理解的算法研究[j] .数字技术与应用,2012(12):101-102.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图