基于视觉传感器的人体运动位姿识别技术毕业论文
2021-10-28 20:45:45
摘 要
本文借助了TensorFlow深度学习框架,使用了Pycharm编程软件,通过Python语言编程,使用了包含大量图片在内的COCO数据集,通过对算法的比较与选择,进行了神经网络的模型训练,完成了对于人体骨骼关键点的检测以及人体运动姿态识别的程序设计。并借助电脑摄像头完成了对于动态视频的人体运动位姿识别以及对于2D图片的人体关键点检测,使用Python的图形界面设计对系统程序的运行界面进行了优化,改善了最终识别结果的美观性,提高了操作的简便性。所得结果对于神经网络的学习和人体运动位姿识别的应用具有重要的指导意义。
本文主要研究了利用神经网络的框架结构去训练模型从而实现人体的运动位姿识别。通过对神经网络的学习、算法的理解、数据集的使用以及程序的编写等工作,基本达到了预期的结果。
本文的特点:使用了TensorFlow的深度学习框架,采用了卷积神经网络的网络结构,设计了图形界面对系统进行优化。
关键词:深度学习;卷积神经网络;位姿识别;关键点检测
Abstract
This article with the help of the TensorFlow deep learning framework, using the Pycharm programming software, through the Python programming language, using the contain a variety of images, COCO data sets, through comparison and selection algorithm, a neural network model training, completed in the human body skeleton key point detection and human motion recognition program design.With the help of the computer camera, I completed the recognition of the body movement and pose in the dynamic video and the key point detection in the 2D pictures. I optimized the operation interface of the system program by using the graphic interface design of Python, which improved the aesthetics of the final recognition result and improved the ease of operation.The results have important guiding significance for the learning of neural network and the application of human movement posture recognition.
In this paper, the frame structure of neural network is used to train the model so as to realize the movement and posture recognition of human body. Through the study of the neural network, the understanding of the algorithm, the use of the data set and the writing of the program, the expected results are basically achieved.
Features of this paper: the deep learning framework of TensorFlow is used, the network structure of convolutional neural network is adopted, and the graphical inferface is designed to-optimize the system
Key Words:deep learning;convolutional neural network;Posture recognition;key point detection
目录
第1章 绪论 1
1.1背景和研究意义 1
1.2国内外研究现状 1
1.3主要研究内容 2
1.4论文结构安排 2
第2章 深度学习与神经网络 4
2.1深度学习 4
2.1.1什么是深度学习 4
2.1.2深度学习的发展 5
2.2 TensorFlow编程框架 5
2.2.1 TensorFlow简介 5
2.2.2基于TensorFlow的模型构建 5
2.3神经网络 7
2.3.1神经网络之前向传播 7
2.3.2神经网络参数优化 8
2.3.3反向传播算法 9
2.4卷积神经网络 10
2.4.1卷积神经网络的概念 10
2.4.2卷积神经网络的结构 10
2.5本章小结 13
第3章 人体运动位姿识别 14
3.1人体运动位姿识别概述 14
3.2基于深度学习的人体运动位姿识别 14
3.2.1位姿识别方法分类 14
3.2.2 2D人体运动位姿识别 15
3.2.3关键点检测 16
3.2.4位姿识别数据集 16
3.2.5算法详解 17
3.3本章小结 21
第4章 系统实现方案 22
4.1训练模型 22
4.2 2D图片的静态位姿识别 24
4.3动态视频的位姿识别 25
4.4基于Python的图形界面设计 26
4.5本章小结 28
第5章 总结与展望 29
5.1论文总结 29
5.2未来展望 29
参考文献 30
致 谢 31
第1章 绪论
1.1背景和研究意义
从当年的座机电话到现如今的智能手机比比皆是,科技的日新月异以及不断更新的智能产品逐渐的走入了人们的日常生活,并且遍布到了学习,娱乐以及生活的方方面面。比如现在常见的人脸支付,人脸通行等已经普及在人们日常生活中的智能应用。
在计算机视觉领域,越来越多的研究都开始与人类的生活息息相关。这一领域主要研究的内容有:图像识别、模式识别、目标检测、人体位姿识别等。与此同时,人机交互的概念被越来越多的提到,人机交互是指人与机器进行互动的行为,这一前提是机器人可以读懂人的语言、行为等。在很多场景比如自助服务、自助售货机中,人机交互有着重要作用。传统的人机交互主要依靠键盘、按钮等接触型的交互模式,但随着社会的发展和人工智能的不断成熟,人们希望拥有更加智能,更加简单的人机交互模式,比如通过人体动作、声音等来实现交互。因此人体的姿势识别成为了人机交互领域里的一个研究热点,人体位姿识别的发展也将为人与机器人的交流带来更多的可能。
人体姿态识别技术直接通过图像设备采集数据去理解人的行为,这一技术可以应用在很多领域,比如现在火热的VR技术,在玩VR游戏的时候可以通过对游戏者的动作进行分析识别,智能的识别出游戏者发出的指令,这能带来更好的游戏体验。此外,在智能监控领域也可以使用姿态识别技术,比如独居老人的安全问题,可以在独居老人的家中安装摄像头来观察老人的状态,当老人在家中走路出现跌倒等特殊的行为时,摄像头就可以发现异常并给家人及时的预警。所以人体姿态识别不仅是人工智能的重要方向,同时对未来普及人们的日常生活也很有意义。虽然现如今已经开发了很多用于人体姿态识别的佩戴设备或者一些高科技的传感器,被应用于人机交互领域,但是由于高昂的价格等因素并没有被人们广泛使用。而普通的摄像头在人们的生活中更为常见与普及,而且图像的获取也更为方便,因此研究基于一般图像信息的人体姿态识别更具有意义。