登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 轮机工程 > 正文

基于深度学习的学术论文创新句自动识别研究毕业论文

 2021-11-05 19:37:33  

摘 要

学术论文创新性评价是学术评价的一项重要任务,对于科研绩效评估、创新知识传播、和领域研究水平提升具有重要的作用。面对已经到来的学术大数据和智能时代,传统的以指标构建、指标计量和专家解释为主的评价思路,受限于专家的经验与主观判断,已经不能满足日益增长的智能化、语义化、多元化评价需求。同时,以人工智能、自然语言处理为代表的计算技术的逐渐成熟,也为学术论文内容层面的创新挖掘带来了新的机遇。想要实现内容层面的创新性评价,首先要准确的找到学术论文中的创新点,因此本文提出了基于深度学习的学术论文创新句识别研究,主要工作包括:

1.归纳总结学术论文中创新句的特点,探讨了创新句语言学特征。基于对特征的分析,构建了一个领域无关语言学特征引导词汇和领域专业词汇相结合的学术论文句子标注框架。

2.将主题相关性、新颖性纳入创新性的挖掘,利用新颖的主题词或主题词组合对论文句子进行筛选。同时提出一种基于7类引导词的创新点句子抽取方法,通过设置相应的规则,能够将不同句子结构但包含论文创新点的句子从语料中抽取出来。

3.综合考虑创新点句子的不同表述方式及对论文创新性支持程度的强弱,提出了创新句的分类标准。通过人工标注的结果,检验了各个类别之间的区分度,证明了分类标准的合理性。

4.在人工标注的基础上,利用深度学习的方法,完成创新句的自动识别分类研究。将其中论文创新性支持程度的弱的句子视为是创新成分较少或者没有创新的,从候选创新句中删除,能较好地从学术论文中找到文章的核心创新句,达到了突出文章核心创新工作的效果。

5.对比多种不同的分类方法,比较不同深度学习模型的效果,证明了选择Albert模型的合理性,以及该模型在处理创新句分类问题上的优越性。

本研究的意义在于通过上述方法可以准确的识别文章中的创新点句子,突出论文的创新性工作。一方面,可以降低同行评议中的审稿压力,在创新知识传播、研究方向梳理等方面具有较高的应用价值;另一方面,为从论文句子内容层面评价论文创新性做出了尝试和基础铺垫。

关键词:创新句抽取;学术论文;深度学习;Albert模型

Abstract

The innovative evaluation of academic papers is an important task of academic evaluation, and plays an important role in the evaluation of scientific research performance, the dissemination of innovative knowledge, and the improvement of field research. In the face of the era of academic big data and intelligence that has come, the traditional evaluation ideas based on index construction, index measurement and expert interpretation are limited by the experience and subjective judgment of experts, and can no longer meet the increasing intelligence,semantics and diversified evaluation needs. At the same time, the gradual maturity of computing technologies represented by artificial intelligence and natural language processing has also brought new opportunities for innovative mining at the content level of academic papers. To achieve innovative evaluation at the content level, first of all, we must accurately find the innovative points in academic papers. Therefore, this paper proposes research on the identification of innovative sentences in academic papers based on deep learning. The main work includes:

1. Summarize the characteristics of innovative sentences in academic papers and discuss the linguistic features of innovative sentences. Based on the analysis of features, a domain-independent linguistic feature-guided vocabulary and domain professional vocabulary sentence annotation framework is constructed.

2. Incorporate topic relevance and novelty into innovative mining, and use novel subject words or combination of subject words to screen the sentences of the thesis. At the same time, an innovative point sentence extraction method based on 7 types of guide words is proposed. By setting corresponding rules, sentences with different sentence structures but containing the innovative points of the thesis can be extracted from the corpus.

3. Comprehensively considering the different expressions of the innovative point sentences and the strength of the degree of support for the innovation of the paper, a classification standard for innovative sentences is proposed. Through the results of manual annotation, the distinction between each category is tested and the classification standard is proved Rationality.

4. On the basis of manual annotation, use deep learning to complete the automatic identification and classification of innovative sentences, and consider the sentences with weak support for the innovativeness of the paper as those with few or no innovations. From candidate innovations The deletion of sentences can better find the core innovation sentence of the article from the academic paper, and achieve the effect of highlighting the core innovation work of the article.

5. Comparing many different classification methods and the effects of different deep learning models, which prove the rationality of choosing the Albert model, as well as the superiority of the model in dealing with the classification of innovative sentences.

The significance of this research lies in that the above methods can accurately identify the innovative point sentences in the article and highlight the innovative work of the thesis. On the one hand, it can reduce the pressure of peer review in peer review, and has high application value in innovative knowledge dissemination and research direction combing; on the other hand, it has made attempts and foundations for evaluating the innovation of the paper from the level of sentence content of the paper.

Key Words:Innovative Sentence Extraction;Academic Papers;Deep Learning;Albert Model

目录

第1章 绪论 1

1.1研究背景与意义 1

1.2相关研究 2

1.2.1文本信息抽取的研究现状 2

1.2.2创新句识别的研究现状 3

1.2.3深度学习语言模型介绍 4

1.3研究内容 8

第2章 学术论文创新句特征分析 10

2.1创新的理论及特点 10

2.2创新句内涵特征分析 10

2.4创新句的定义阐释 11

2.5创新句特征提取与分析 11

2.3本章小结 13

第3章 基于主题的创新句抽取 14

3.1数据选择与获取 14

3.2数据预处理 16

3.3基于MeSH主题词的创新句抽取 17

3.4基于最大双向匹配的创新句筛选 17

3.5本章小结 20

第4章 学术论文创新句识别 21

4.1创新句分类与标注 21

4.2创新句识别模型训练 24

4.3实验结果分析与模型评估 25

4.4本章小结 26

第5章 结论与展望 27

5.1研究结论 27

5.2研究展望 27

致谢 29

参考文献 30

第1章 绪论

1.1研究背景与意义

学术论文是研究人员从事科学研究[1]、表述科研成果的重要载体形式和传播方式之一,其内容能够充分体现学科领域最新的研究现状和研究进展,具有发现新观点、传播新方法、承载新理论、推广新技术等重要作用,这决定了内容创新性是科学论文的灵魂,可以直接体现一篇论文的学术价值和发表价值。

2016年5月,国务院印发《国家创新驱动发展战略纲要》,首次明确提出了建立健全科学分类的创新评价制度体系;2018 年 7 月,中共中央办公厅、国务院办公厅先后颁布了 《关于深化项目评审、人才评价、机构评估改革的意见》和《关于优化科研管理提升 科研绩效若干措施的通知》两份重要文件,明确要求要改进科技人才评价方式,注重标志性成果的质量、贡献、影响;2020年3月,教育部、科技部先后发布了一系列关于我国科技工作的指导意见通知《关于破除科技评价中“唯论文”不良导向的拖杆措施(试行)》、《关于规范高等学校 SCI 论文相关指标使用 树立正确评价导向的若干意见》,明确要求破除学术论文评价 “SCI 至上”的价值标准,评审评价突出创新质量。这些文件表明,学术成果的创新评价方式的转变与完善,是当下急需解决的热点问题。学术论文作为科学研究成果形式之一,建立并完善论文创新性评价体系,是其中最基础也是最重要的一环。

传统的学术论文创新性评价研究主要可分为定性的同行评议和定量的科学计量学两个视角,同行评议是指研究领域相同的专家对某个科研成果进行评价,是最古老、最普遍的学术论文评价方法。但随着科研水平的不断提高,每年发表的论文数量呈指数级增长,以中国知网收录的数据为例,就柴油机领域而言,如图1.1所示,发表于1970年的文献数量仅80篇,1980年为713篇,而到了2000年则增加到3231篇,2019更是增加到了6662篇。面对这海量的研究成果,使用同行评议的方式进行评价时,一方面相对于定量的评价,效率较为低下,不适合用于海量的高效论文评价。另一方面,容易受到专家主观性的限制或其他非科学因素的影响。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图