基于transformer的机器翻译系统
2022-11-10 10:55:38
论文总字数:35557字
摘 要
近几年,全世界社会与经济走上了飞速发展的道路,随着经济全球化程度加深,各国间的合作愈发紧密,对于机器翻译的需求日益增加。人们对于自然语言处理的研究占据了重要的地位,而机器翻译作为自然语言研究领域的一个重要研究分支,同时也是人工智能领域的一个课题,在历来的研究中都占据着不可替代的位置。
机器翻译属于及时翻译,又被称为自动翻译,是利用计算机将一种源语言,按照相应的语法规则转换为另一种目标语言的过程。机器翻译具有重要的实用价值,机器翻译在经济、文化交流等方面起着积极的作用。机器翻译可以在短时间内用较低的成本、较高的效率处理大量的信息。在这些背景下,对于机器翻译的研究是十分重要并且有意义的,因为它不仅可以提高市场交易的效率,还可以促进中国与其他国家之间的交流。英语作为全世界最流行的语言,一直在语言中占据重要地位,因此在机器翻译中汉英机器翻译的能力一直是自然语言处理中讨论的焦点。在机器翻译的实践中,最重要的就是翻译的精度,这个取决于目标语言与源语言之间的语法规则,这也是本文研究的现实意义。在最近,神经机器翻译逐渐取代了之前的统计机器翻译方法。然而与统计机器翻译相比,尤其是在大规模数据集的神经机器翻译系统还存在着许多缺陷,受到语料库的限制,神经机器翻译中出现了OOV(Out-Of-Vocabulary)问题。本文将基于目前最流行的谷歌提出的transformer模型,采用多头注意力机制与前馈神经网络来对模型网络进行搭建。
基于上述问题,本文作出如下学习与研究:
(1)为了研究如何解决神经机器翻译在罕见词汇上出现的OOV问题,本文将英文文本预处理的词干提炼技术与数据压缩算法相结合,使用这个方法将英文文本分割为由单词组成的序列,同时将中文文本分割为由汉语词组成的序列。
(2)本文基于transformer模型中提出的Attention机制,以谷歌翻译开发的机器翻译系统为基础进行实验,通过这种方式来获得较为准确的翻译。
关键词: 机器翻译;transformer;人工智能;自然语言;注意力机制
ABSTRACT
In recent years, the world's society and economy have embarked on the road of rapid development. With the deepening of economic globalization, the cooperation between countries is getting closer, and the demand for machine translation is increasing. People's research on natural language processing occupies an important position, and machine translation, as an important research branch in the field of natural language research is also a subject in the field of artificial intelligence.
Machine translation is a kind of timely translation, also known as automatic translation. It is a process of using computer to convert a Source language into another Target language according to the corresponding grammar rules. Machine translation is of great practical value. It plays an active role in economic and cultural exchanges. Machine translation can process a large amount of information with low cost and high efficiency in a short time. In this context, the research on machine translation is very important and meaningful, because it can not only improve the efficiency of market transactions, but also promote the communication between China and other countries. As the most popular language in the world, English has always occupied an important position in the language, so the ability of Chinese English machine translation has been the focus of discussion in natural language processing. In the practice of machine translation, the most important thing is the accuracy of translation, which depends on the grammatical rules between the Target language and the Source language, which is also the practical significance of this paper. Recently, neural machine translation has gradually replaced the previous statistical machine translation method. However, compared with statistical machine translation, especially in the large-scale data set of neural machine translation system, there are still many defects. Due to the limitation of corpus, OOV (out of vocabulary) problem appears in neural machine translation. Based on the transformer model proposed by Google, which is the most popular model at present, this paper uses multi attention mechanism and feedforward neural network to build the model network.
Based on the above problems, this paper makes the following study and research:
(1) In order to solve the OOV problem of neural machine translation in rare words. This paper combine the stem extraction technology of English text preprocessing with data compression algorithm, and use this method to divide the English text into the sequence of words, and the Chinese text into the sequence of Chinese words
(2) In this paper, based on the Attention mechanism proposed in the transformer model, experiments are carried out on the basis of the machine translation system developed by Google translation. In this way, we can get more accurate translation.
Keywords: machine translation, transformer, Artificial Intelligence, language, attention
目 录
第一章 绪论 1
1.1研究课题背景与意义 1
1.2机器翻译国内外研究现状以及发展历程 2
1.2.1 基于规则的机器翻译 3
1.2.2 统计机器翻译 4
1.2.3 神经网络机器翻译 5
1.3 论文的研究内容 7
1.4论文的主要内容和框架 7
第二章 相关技术内容介绍 9
2.1 语言模型 9
2.2深度学习与神经网络 11
2.2.1梯度下降 11
2.2.2前馈神经网络与反向传播算法 12
2.2.3循环神经网络RNN 12
2.2.4长短记忆神经网络LSTM 13
2.3 神经机器翻译 14
2.3.1 Seq2Seq模型 14
2.3.2 注意力机制 15
第三章 数据集预处理 18
3.1 数据集介绍与分析 18
3.2 数据预处理 19
3.2.1 英文分词 19
3.2.2 中文分词 19
3.3 词向量表示 20
3.4 本章小节 20
第四章 神经机器翻译系统设计 21
4.1 概述 21
4.2 基于仿制谷歌机器翻译系统功能介绍与需求分析 21
4.2.1 机器翻译系统流程分析 21
4.1.2 系统功能介绍 24
4.3 Seq2Seq模型分析 25
4.3.1 基于Bi-LSTM的Seq2Seq模型 25
4.3.2 融合残差网络的Seq2Seq模型 25
4.3.3 融合注意力机制的Seq2Seq模型 26
第五章 系统功能设计与实现 28
5.1 实验环境及参数设置 28
5.2 系统功能设计 28
5.2.1 翻译方式模块设计 28
5.2.2 自定义接口模块 29
5.2.3翻译系统UI界面模块设计 30
5.3 系统功能实现 34
5.4 本章小节 37
第六章 系统测试 38
6.1 测试概述 38
6.2 测试任务与测试范围 38
6.3 具体功能测试 38
总结与展望 40
致 谢 41
参考文献 42
第一章 绪论
1.1研究课题背景与意义
人工智能领域里重要的研究课题为机器翻译。自然语言处理是一个具有高度综合性的课题,它涉及到计算机科学、高等数学、语言科学等多种学科。经过多年的发展,自然语言处理已经形成了自身的理论与解决方式,并且具备自身独有的内容,涵盖的元素丰富多彩:其中有文本分类、情感分析、语音识别、信息检索等。机器翻译作为自然语言处理领域的标志性课题,对机器翻译进行学习,也同样是对于自然语言处理领域的学习。
机器翻译,即字面意思,就是利用机器使得一种语言(称为源语言)到另一种语言(又称目标语言)之间进行自动转换。机器翻译起源于1949年,美国科学家沃伦维恩发表了一篇文章,标志着机器翻译思想正式确立。5年后,IBM公司顺利解决了英译俄问题,将六十余句俄语对话翻译成英文,这是历史上首次真正实现的机器翻译,它坚定的向世人展示了机器翻译的实用性。机器翻译的研究也从此时正式开始。在这之后的10年,机器翻译风靡全球,各国对机器翻译的研究展开了疯狂的研究。但是事情并非一帆风顺,机器翻译在蓬勃发展的道路上突然遭遇阻碍。1966年,美国的语言自动处理咨询委员会(Automatic Language Processing Advisory Committee, ALPAC)发表了一份报告,该报告几乎全盘否定了机器翻译的前景与价值,也是因此,使机器翻译受到严重打击,各种关于机器翻译的项目投人锐减直至几乎消失,短短十几年时间,机器翻译就落人了低谷。直到20世纪七十年代中后期,随着计算机科学的发展、经济社会人类社会的需要,机器翻译迎来复苏并走向繁荣。而后经过几十年的发展,形成了两大类别:一是基于规则的机器翻译;二是基于统计机器翻译。
剩余内容已隐藏,请支付后下载全文,论文总字数:35557字