基于云服务的语义识别在试卷批改中的应用毕业论文
2021-03-29 22:34:30
摘 要
近年来,随着计算机技术与网络的发展,计算机已应用于社会各个领域中,在教育领域中,采用计算机进行组卷,考试与批改的自动阅卷系统已经应用于部分学校中,在客观题批改中,相比于人工批改,计算机可以更快速准确的批改出试卷结果,但对于主观题的批改,由于答案采用自然语言描述,学生个体思维与用词习惯差异巨大,现实中仍采用人工批改。
随着近几年云服务的兴起,越来越多的现实问题可借由网络上现有的云服务平台进行解决,本系统采用了百度云的自然语言处理功能,按照主观题的评分流程,分为:分词,词性标注,关键词提取与句子相似度计算。分词与词性标注可借由百度云完成,句子相似度计算中也应用到了百度云的断短文本相似度计算。
关键词:自动阅卷;云服务;分词;句子相似度计算
Abstract
In recent years, with the development of computer technology and network, computer has been applied to various fields of society. In the field of education, the automatic scoring system for examination and correction has been applied to some schools by using computer to do the test paper. In the correction of objective questions, compared with manual correction, the computer can correct the test results more quickly and accurately. But for the correction of subjective questions, because the answers are described in natural language, the students' individual thinking and vocabulary habits vary greatly, and in reality, manual correction is still used.
With the rise of cloud services in recent years, more and more practical problems can be solved by the existing cloud service platform on the network. The system uses the Baidu cloud Natural Language Processing functions, According to the scoring process of subjective questions, they are divided into word segmentation, part of speech tagging, keyword extraction and sentence similarity calculation. Word segmentation and part of speech tagging can be completed by Baidu cloud, and sentence similarity calculation is also applied to the short text similarity calculation of Baidu cloud.
Key Words:Automated Assessment;Cloud Service;Word Segmentation;Sentence Similarity Calculation
目录
第1章 绪论 1
1.1 研究背景及意义 1
1.2 国内外研究历史与现状 1
1.3 本文主要工作 3
1.4 论文的结构安排 3
第2章 系统设计思路与框架结构 5
2.1 人工智能与教育领域 5
2.2 系统结构 6
第3章 语义识别算法探究 9
3.1 分词 9
3.2 词性标注 9
3.3 关键词提取 10
3.4 句子相似度计算 10
第4章 主观题自动阅卷系统的设计 12
4.1 系统框架 12
4.2 百度云自然语言处理功能探究 13
4.2.1 百度云的使用方法 13
4.2.2 自然语言处理功能的实现 14
4.3 主观题自动阅卷系统的实现 19
4.4 系统评价与总结 20
第5章 总结与展望 21
5.1 总结 21
5.2 展望 22
参考文献 23
致谢 24
绪论
研究背景及意义
近年来,随着计算机技术与网络的发展,计算机已应用于社会各个领域中,在教育领域中,采用计算机进行组卷,考试与批改的自动阅卷系统已经应用于部分领域中,在客观题批改中,相比于人工批改,计算机可以更快速准确的批改出试卷结果,但对于主观题的批改,由于答案采用自然语言描述,学生个体思维与用词习惯差异巨大,现实中仍采用人工批改。
现实中的主观题批改主要采用将试卷扫描进电脑,再由教师上机批改,从本质上来讲,这还是属于人工批改的范畴。主观题的主观性与多义性导致该题型无法提供标准答案,所以,若要通过计算机批改主观题,就要求计算机能较好的对自然语言进行识别,并对其表达的意图进行推测,即对自然语言语义识别。目前,计算机的语义识别技术还在发展阶段,各方面都不够成熟,所以计算机对主观题的批改远未达到投入使用的阶段。然而,计算机对主观题的批改功能却有着重大意义。在现实中,不仅考生具有自己的主观性,批卷老师同样有着主观性,所以,不同的老师对同一个答案可能有着不同的理解,这就为误判埋下了伏笔。在我国高考的语文阅卷中,同一主观题的批改须有至少两位老师进行,老师间批改的分数若相差太大,则要将题目交给改卷组组长,这虽最大限度的排除了老师主观误判的可能性,但也极大的降低了改卷效率,同时浪费了人力物力。若计算机阅卷技术成熟,改卷过程中的效率,环保和准确性问题将迎刃而解。
随着近几年云服务的兴起,越来越多的现实问题可借由网络上现有的云服务平台进行解决,而这其中语义云的出现对计算机自动阅卷有着重大意义。语义云,即自然语言处理引擎及数据聚合平台,能让开发者通过其提供的标准API接口对其自然语言处理功能进行调用。目前,语义云的分词与词性标注功能已能较好实现,而句子相似度计算可能会产生错误。相信在未来,语义云技术走向成熟后,计算机对主观题的批改将能投入使用。
国内外研究历史与现状
国外对于主观题自动阅卷的研究开始较早,于20世纪60年代就开始研究,并且得出了一系列成果,如:Project Essay Grade(PEG),Intelligent Essay Assessor(IEA),Electronic Essay Rater(E-Rater),Writing RoadmapTM2.0,The Automated Text Marker(ATM)等。
以上系统虽在一定程度上实现了主观题阅卷的功能,但也有其自身的缺点。