基于深度学习的语音识别模型在植保领域的应用开题报告
2023-02-19 20:15:22
1. 研究目的与意义、国内外研究现状(文献综述)
语音识别(speech recognition)是计算机能够自动的将人类语言内容转化为相应的文字或者指令,达到人与机器交互的技术利用语音识别技术[1],可以让计算机懂得人类的语言,也能让机器人技术更加的自动化、人性化。它是一门综合性的交叉学科,涉及到语言学、心理学、数理与统计等多个领域。
从开始研究语音识别技术至今,语音识别技术的发展已经有半个多世纪的历史。语音识别技术研究的开端,20世纪50年代att贝尔实验室发明的audry系统,可以说是世界上第一个语音识别系统,这个系统可以对十个英文数字来进行识别[2]。20世纪60年代,人工神经网络引入语音识别,这一时代的两大突破是线性预测编码技术和动态时间弯折技术[3]。70年代,动态时间规整技术基本上成熟,矢量量化(vq)和隐马尔可夫理论(hmm)也不断完善[4]。而上世纪90年代后,语音识别技术开始应用于全球市场,许多著名科技互联网公司ibm,apple等[5]。进入21世纪,语音识别技术传统的框架随着微软公司的研究突破有所改变,深度学习和应用开始进入爆发期,尤其是语音识别领域取得了突破性的进展。国内关于语音识别的研究和探索也取得了许多重要成果,综合错误率可控制在10%以内[6]。随着科技的发展,语音识别也扩展了它的应用范围,比如应用特定的语言识别模型,训练采集的特定语料,语音识别技术应用于语音指令方面有着很好的控制性作用。这就可以使得一些在不便于工作的环境中,给人们带来很好的便利。
深度学习作为近年来机器学习领域中的一个新的研究方向,备受学术界的关注,同时也推动了工业界等其他领域的发展,并且应用到农业植保领域。比如可以运用语音识别系统发出相应的指令,获得田间病虫害预测,从而使得利用该技术来完成相应的工作。
2. 研究的基本内容和问题
1.1研究目标
语音识别是一门交叉学科,它以语音作为研究对象,将语音信号转化成为相应的文字或者指令,最终实现人与机器之间的交互。语音识别已经越来越多的应用于各个领域,本课题在深度学习建立语音模型的基础上,利用训练好的语音模型对植保领域的语料进行测试,以此来语音识别实现在植保及农业领域的应用。
3. 研究的方法与方案
研究方法
语音识别方法主要有以下四种方法:
①基于语言学和声学的方法 ②随机模型法
4. 研究创新点
1)深度学习与语音识别相结合
深度学习是人工智能方面研究的热点,广泛应用于语音、图像、文本识别,且取得了显著成果。而在未来的人机交互中,语音识别作为一种重要接口,大大影响了用户智能系统体验。将这两种技术融合,可收集语音识别系统的训练数据,增强训练鲁棒性,加强深度网络的泛化能力。同时,提高深度网络准确识别语音识别系统,降低噪音对语音识别系统的影响。
2)以关键词作为识别点可以简化流程
5. 研究计划与进展
2018.9-2018.10
建立语音样本库,进行大量的语音样本采集,语音样本为植物保护领域会出现的主要病虫害以及对机器的预调模块,共计133个关键词,例如病虫分级、主要农作物(水稻、小麦、油菜、玉米、棉花、大豆等),农作物上会出现的主要病虫害,此处以小麦为例,作为关键词的病害有“散黑”、“梭条”、“纹枯”、“锈病”、“白粉”、“赤霉”、“麦蚜”、“麦蜘蛛”、“腥黑”、“粘虫”,由于不同人音调音色会存在差异,因此尽可能使得样本分布广泛。
2018.11-2019.1