基于单片机的语音交流辅助器的设计文献综述
2020-05-11 23:24:16
一.引言
在互联网和自动化技术不断发展的影响下,智能家居,智能穿戴已经成为了当今物联网技术发展的重要热点方向之一。现代语音识别技术与嵌入式技术相结合,使得越来越多的消费类电子如:智能家电,手机,学习机等应用在我们的生活中。我国版图辽阔地大物博因而地区差异性明显。又因为我国是多民族国家,各民族存在语言差异,并且少数民族语言和各地区方言作为我国文化多样性的表现和非物质文化遗产的传承一直保存并沿用着,因而使用方言交流的地区尤其是偏远地区与使用官方普通话的地区存在一定的交流障碍现象。以智能穿戴为背景,将语音识别技术应用于智能穿戴环境中。实现由单片机控制的语音交流辅助器,辅助普通话与方言之间的交流。将会给人们的生活带来极大的便利。
二.语音识别技术的研究现状
在信息化快速发展的当今社会,随着计算机技术的不断发展,计算机自动语音识别成为近五十多年来学者研究和探索的目标,对语言识别技术的研究已经引起了人们越来越广泛的关注,语音识别已成为信息产业领域的标志性技术,并且逐渐成为计算机技术研究领域的热点问题之一,从而使信息化社会加大向自动化和智能化方向不断发展的步伐。
在国外,由于语音识别技术发展较早,技术较为成熟,市场研发竞争比较激烈。早在20 世纪50 年代,语音识别就开始被研究。1952 年,Davis 等人在Bell 研究所成功研制出世界上第一个语音识别系统,可以识别10 个英文数字发音的Audry 系统;二十世纪六十年代科学家首次将动态规整算法应用于语音分析的研究中,动态规整算法对语音信号研究中较为重要的不等长问题的解决有很明显的效果。在70、80 年代,线性预测技术开始应用到语音识别上去,在语音特征参数的提取方面取得了巨大的突破。与此同时在语音识别的研究中也取得了众多成就,研究人员将动态规划算法应用于语音识别中,提出了当时掀起语音识别研究热潮的动态时间规整算法,它主要是语音信号将时间和距离结合起来进行规整计算,在小词汇量的语音识别研究中得到了广泛的应用。后来,研究人员在动态时间规整算法之土又提出了矢量量化算法,之后又提出了在语音识别领域最为著名的隐马尔可夫模型理论,该模型的提出为语音识别研究尤其在识别算法方面开拓了新的研究方向。隐马尔可夫模型不同与于传统识别算法将待识别语音模型与训练模型进行特征匹配,而是运用统计学模型对语音信号进行分析识别,通过大量实验表明该模型对连续语音的识别有很好的效果。通过对语音识别进行更深层次的研究,世界上第一个非特定人连续语音识别系统被研制成功;在90 年代及进入21 世纪,语音识别系统己经进入实际应用阶段,许多大IT企业先后都为语音识别系统的设计与研发投入大量资金。并且由于Microsoft、语音识别芯片等的成功开发,使汉语语音识别和嵌入式语音识别技术越来越受到人们的关注,从而促进了语音识别技术产品的商业化[1]。
在国内,语音识别的研究开始于上世纪七十年代,其中中国科学院声学所是所有研究机构中最早进行探索的,1973年开始计算机语音识别。由于条件所限,此一阶段我国的语音研究一直发展缓慢。进入80年代以后,计算机应用技术在科研领域逐渐普及,数字信号处理技术进一步发展,为国内很多机构进行语音技术的研究提供了基本条件。随着国际语音技术的发展热潮,国内许多研究单位投入到语音识别研究工作中。1986年3月,高科技发展计划(863计划)启动,语音识别作为未来智能计算机系统的一个重要组成部分而被列为研究课题。在863计划的支持下,我国语音识别技术进入了有组织的研究阶段,并决定每隔两年召开一次语音识别的专题会议。目前我国语音识别的基础研究涉及高级人工智能、人工神经网络、小波技术和机器学习等理论,其研究成果必然会推动我国语音识别技术的发展[2]。
三.普通话使用的研究现状
语言是交际的工具,中国是一个民族多、人多、地多、资源多、历史多、方言多的国家。普通话作为口语交际的载体,不仅是我国的官方语言,并且还是我国各民族、各地域之间交流的唯一工具,也是世界上使用人数最多的语言。普通话是我国 56 个民族民族的共同语,也是规范化的现代汉语。
目前由于计算机输入法的发展,智能手机的发展,使得我们利用键盘,手机输入汉字时普遍的、较快捷的方式时使用普通话的汉语拼音拼写汉字。由此可见,普通话对于每个人而言,它都是一种非常有用的语言,在促进全社会树立语言文字规范意识,推动语言文字工作向纵深发展方面发挥了重要的作用。自 2002 年开始,孔子学院每年都会举办的”汉语桥”比赛,各个国家都会派出队员积极准备该项赛事。”汉语桥”经历十几年的发展,使得全球的汉语热持续升温。汉语普通话也已经成为推广我国历史、民族文化的重要桥梁。所以,讲好汉语普通话更是我国公民应该具有的基本素质。当今汉语普通话面临的问题,可以分为:地域性和民族性。有些地区由于历史、生活等原因的问题,使得在地方语言的大环境下,无法学习标准的普通话发音。比如:有些地域的人发音”四”和”十”时其他人无法分辨;很多民族留有自己的语言,并在生活中使用自己的民族语言或者地方语言,不使用普通话,导致学习者普通话口语发音错误[15]。
四.发展趋势