基于卷积神经网络的目标检测开题报告
2022-12-06 09:48:24
1. 研究目的与意义
随着图像处理技术的发展、数码产品的推广以及互联网的普及,图像日益成为人类生活中获取信息的重要来源和传递信息的重要载体。目前,全球互联网用户每天上传的图像达到数亿张。面对这种爆炸式的数据增长,已经不可能通过人力分析每张图像,迫切需要利用计算机准确而快速地捕获图像的有效信息,实现图像智能分析。国务院印发的《“十三五”国家科技创新规划》提出要把图像智能分析作为人工智能的关键技术重点支持。图像智能分析的关键步骤之一是目标检测。作为计算机视觉领域中一个重要的课题,目标检测主要利用图像处理和机器学习的方法定位图像中感兴趣的目标,准确地判别每个目标的标签给出每个目标在图像中的边界框。精确的目标检测是后续图像智能分析(跟 踪、识别、验证、匹配、检索等等)顺利进行的必要条件。因此,目标检测在诸如智能视频监控、车辆自动驾驶、机器人环境感知、医学图像分析、大规模图像检索、视觉人机交互等领域都有广泛的应用。目标检测非常有挑战性,主要难点在于两方面:1)对于目标,由于姿态改变、局部遮挡、尺度不一等因素,会引起目标的外观发生较大形变,导致目标检测产生漏报;2)对于场景,由于光照变化和视角变更等因素,同样会使目标的外观发生一定形变,并且场景越复杂,区别目标与非目标的难度就越大,导致目标检测产生漏报和误报。目前,在光照、视角和姿态相对固定的简单场景中,传统目标检测方法可以取得较好的检测结果。然而,在实际场景中,由于存在以上影响因素,传统目标检测方法的准确度达不到实际需求。其主要原因在于传统目标检测方法采用手工制作的特征,对目标的表达能力不足,抗形变能力差,导致难以区分目标特征和非目标特征。
为了解决上述问题,在2006年geoffrey hinton提出了深度学习,利用深度神经网络从大规模数据中自动地学习特征。相比于手工制作的特征,深度神经网络学习的特征抽象层次更高,内容更丰富,表达能力更强。常用的深度学习模型包含限制波尔兹曼机、自编码器和卷积神经网络。随着深度学习的不断发展,研究者发现卷积神经网络更适合用于目标检测,准确度可以获得较大的提高。一方面是因为卷积神经网络提取了高层特征,提高了特征的表达能力;另一方面是因为卷积神经网络将目标检测的关键步骤融合在同一模型中,通过端到端的训练,进行整体的功能优化,增强了特征的可分性。因此,基于卷积神经网络的目标检测成为当前计算机视觉、人工智能、模式识别等领域的研究热点之一,无论是在学术界还是在工业界都得到了广泛的关注。在学术界,许多国内外顶级科研团队把基于卷积神经网络的目标检测作
为主要研究方向。在工业界,许多知名企业设立专门的团队开展基于卷积神经网络的目标检测方法研究。并且,每年举办的imagenet大规模视觉识别竞赛为目标检测提供了一个公平的比赛平台。自从2013年设立目标检测任务以来,每次竞赛的冠军队伍都对卷积神经网络做出了改进,因此该竞赛成为研究基于卷积神经网络的目标检测的风向标。同时,众多科研力量的投入使基于卷积神经网络的目标检测发展迅速,每年都有相关的科研成果发表于计算机视觉、机器学习和人工智能领域的国际顶级会议和国际顶级期刊上。尽管如此,当前基于卷积神经网络的目标检测方法仍然不能够满足现实生活的应用需求,许多关键问题没有得到圆满解决。例如,问题一:现有目标检测器缺乏场景自适应性。当监控场景的光照和视角发生变化时,目标检测的准确度将急剧下降。为此,可以利用迁移学习的思想调整目标检测器,使目标检测器获得针对监控场景的自适应能力。问题二:现有目标检测器缺乏记忆和预测机制。单纯在卷积神经网络中堆加层次将难以提高目标检测的准确度。为此,可以根据人类的认知过程,通过模拟人眼的视觉系统以及大脑的记忆和预测机制设计全新的目标检测器,增强目标检测器的学习能力、记忆能力和预测能力。因此,本课题将针对以上两个问题开展基于卷积神经网络的目标检测方法研究,具有重要的理论价值和实际意义。
2. 研究内容与预期目标
主要内容是介绍目标检测的相关理论,卷积神经网络的相关理论和连接式,对现有的典型的目标检测算法进行分析,找出算法的优缺点,利用卷积神经网络并设计新的算法改善现有算法的缺点,具体研究内容有以下几个方面:
(1)梳理现有的目标检测算法,对国内外研究现状进行分析总结,找出典型的目标检测算法的优缺点。
(2)梳理现有的典型的深度神经网络,找出最合适的神经网络模型,学习卷积神经网络模型的相关理论和连接模式。
3. 研究方法与步骤
主要以faster r-cnn框架为基础设计和实现车辆检测模型.在模型构建的过程中,主要包括两个过程:模型训练和模型测试。在模型训练阶段,为了提高训练车辆检测模型的效率, 根据预训练模型结构,搭建车辆检测网络并用数据量较小的车辆图像数据对网络参数进行微调。在模型测试阶段,主要利用不同场景下的测试样本来验证检测模型的有效性。
(1)模型训练
通过交替训练、共享卷积层特征的方式,将rpn模型和faster r-cnn模型统一在一个深度网络框架内。
4. 参考文献
【1】刘士新,冯海兰. 动态车辆路径问题的优化方法[j]. 东北大学学报: 自然科学版,2008,29( 4) : 484-487.
【2】张晓楠,范厚明. 模糊需求车辆路径优化及实时调整[j]. 上海交通大学学报,2016,50( 1) : 123-130.
【3】马华伟,杨善林. 可选时间窗车辆调度问题的改进禁忌搜索算法[j]. 系统仿真学报,2008,20( 16) : 4454-4457.
5. 工作计划
(1)2022.2.25-2022.3.10 开题定稿,资料的搜集与理解,完成外文资料的翻译。
(2)2022.3.11-2022.4.14 基于卷积神经网络的目标检测的课题分解,熟悉matlab环境及图像处理工具箱,学习卷积神经网络,了解常用的用于检测的cnn类型。
(3)2022.4.15-2022.5.9 课题完善修改,实现目标检测算法,并对实现的方法的性能作分析。