基于faster R-CNN深度学习框架的银杏花穗识别文献综述
2021-12-28 23:05:39
全文总字数:6868字
基于faster R-CNN深度学习框架的银杏花穗识别
摘要: 近年来,目标识别的快速发展使得其在多个领域均有应用,而卷积神经网络在目标识别与检测方面有广泛的应用。银杏花粉的营养价值很高,是多种保健品的生产原料。银杏植株雌雄异体,采集雄株花粉还可用于人工授粉,以提高种子发芽率。但银杏花粉的采摘时机很短,每年春天只有一周左右的窗口期,且在即使同一片树龄相似的人工林中,不同树木之间、甚至每棵树上的花穗成熟也各有早晚。为了实现自然环境下银杏花穗的快速准确识别,根据银杏雄性花穗的特点,手动创建模型标签,利用深度学习中的卷积神经网络,训练计算机可以自动识别检测出银杏花穗,拟使用alexnet训练模型,faster RCNN网络框架,通过卷积层、池化层、全连接层等一系列处理,得到高的银杏花穗识别平均准确率和平均召回率。提高收集效率,降低人工成本,最大幅度降低危险性、减少劳动强度。
关键词:深度学习;卷积神经网络;银杏花穗;自动检测
0 前言
在如今技术更迭的时代,深度学习在图像识别领域发展迅猛,通过建立和模拟人脑的神经系统来解释图像中的各个特征数据能够挖掘出图像中所需检测目标深层次特征。这种数据特征对于识别目标的分类具有很好的表征能力。而我国作为世界上传统的农业大国,农业的发展情况对我国的经济发展具有深远的影响。所以我国正致力于发展机械设备智能化,使无论在农作物病虫害识别还是农作物采摘都尽可能替代传统人工操作模式。深度学习(Deep Learning)是机器学习( Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标:人工智能( Artificial Intelligence)。卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习)的代表算法之一 [1]。目前有很多领域的人工操作相当费时费力,但是利用卷积神经网络的深度学习模型能够有效的识别目标,提高工作效率和结果准确性。
1国内外研究概况
1.1 卷积神经网络发展史
1.1.1 CNN
第一个卷积神经网络是1987年由Alexander Waibel等提出的时间延迟网络(Time Delay Neural Network, TDNN)。TDNN是一个应用于语音识别问题的卷积神经网络,使用FFT预处理的语音信号作为输入,其隐含层由2个一维卷积核组成,以提取频率域上的平移不变特征 [2]。1998年Yann LeCun及其合作者构建了更加完备的卷积神经网络LeNet-5并在手写数字的识别问题中取得成功 , LeNet-5沿用了LeCun (1989) 的学习策略并在原有设计中加入了池化层对输入特征进行筛选 。LeNet-5及其后产生的变体定义了现代卷积神经网络的基本结构,其构筑中交替出现的卷积层-池化层被认为能够提取输入图像的平移不变特征[3]。此时的卷积神经网络已经可以帮助人们识别人脸和手势。为得到更多完整信息人们将图像识别分为具体的两个任务,一是识别,二是定位。例如输入一张图片,用各种大小的框遍历整张图片,将图片截取出来,输入到CNN,然后CNN会输出这个框的得分(classification)以及这个框图片对应的x,y,h,w(regression),即图像分割。根据得分的高低,选择高分的黑框作为目标位置的预测。