基于知识图谱的多轮对话问答系统设计与实现开题报告
2023-10-27 16:00:35
1. 研究目的与意义
自动问答(question answering, qa)是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务。不同于现有搜索引擎,问答系统是信息服务的一种高级形式,系统返回用户的不再是基于关键词匹配排序的文档列表,而是精准的自然语言答案。近年来,随着人工智能的飞速发展,自动问答已经成为倍受关注且发展前景广泛的研究方向。
自动问答的研究历史可以溯源到人工智能的原点。1950年,人工智能之父阿兰图灵(alan m. turing)在《mind》上发表文章《computing machinery andintelligence》,文章开篇提出通过让机器参与一个模仿游戏(imitation game)来验证“机器”能否“思考”,进而提出了经典的图灵测试(turing test),用以检验机器是否具备智能。同样,在自然语言处理研究领域,问答系统被认为是验证机器是否具备自然语言理解能力的四个任务之一(其它三个是机器翻译、复述和文本摘要)。自动问答研究既有利于推动人工智能相关学科的发展,也具有非常重要的学术意义。
从应用上讲,现有基于关键词匹配和浅层语义分析的信息服务技术已经难以满足用户日益增长的精准化和智能化信息需求,已有的信息服务范式急需一场变革。2011 年,华盛顿大学图灵中心主任 etzioni 在 nature 上发表的《search needs a shake-up》中明确指出:在万维网诞生 20 周年之际,互联网搜索正处于从简单关键词搜索走向深度问答的深刻变革的风口浪尖上。以直接而准确的方式回答用户自然语言提问的自动问答系统将构成下一代搜索引擎的基本形态。同一年,以深度问答技术为核心的 ibm watson 自动问答机器人在美国智力竞赛节目 jeopardy 中战胜人类选手,引起了业内的巨大轰动。watson 自动问答系统让人们看到已有信息服务模式被颠覆的可能性,成为了问答系统发展的一个里程碑。此外,随着移动互联网崛起与发展,以苹果公司 siri、google now、微软 cortana 等为代表的移动生活助手爆发式涌现,上述系统都把以自然语言为基本输入方式的问答系统看做是下一代信息服务的新形态和突破口,并均加大人员、资金的投入,试图在这一次人工智能浪潮中取得领先。
2. 研究内容和预期目标
2.1研究内容
智能问答系统可以视为自然语言处理领域的分类内容,利用机器学习算法对样本构建一个预测模型。在知识图谱中预测落点,并提取出回答。近年来,“天猫精灵”、“小艺”等对话机器人能理解人类语言并作出简短问答,但回答常常会不尽如人意。为实现更好的智能回答,提高对话准确性,复杂性和可信度,设计了针对与某一领域的基于知识图谱的智能问答机器人。研究使用apache-jena存储知识、rdf三元组表示知识、jieba分词处理和echarts构建知识图谱。基于python diango框架和apache-jena-fuseki图数据库开发问答系统。起初计划只针对于某一领域,在拓展行业数据集构建更多领域的知识图谱后,可以运用到更过的场景中。
2.2预期目标
3. 研究的方法与步骤
3.1本课题拟采用以下研究方法:
文献研究法,查阅大量与本课题相关的的期刊论文。
数据建模法,建立知识图谱模型。
4. 参考文献
[1]张艺玮,周乾,陈伟,赵雷.面向多模态知识图谱的实体对齐方法研究[j].小型微型计算机系统.
[2]刘玉华,翟如钰,张翔,王毅刚,周志光.知识图谱可视分析研究综述[j].计算机辅助设计与图形学学报.
[3]王常珏,张强,王盟燏,朱泽,李玉海.基于本体的剧曲类非遗知识图谱构建研究-以元曲为例[j].图书馆杂志.
5. 计划与进度安排
(1)1月11日至2月15日 分析课题,查找资料。
(2)2月16日至2月28日 完成需求分析。
(3)3月01日至3月16日 完成开题报告。