登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 通信工程 > 正文

基于字典学习的人体动作识别开题报告

 2021-03-10 23:40:10  

1. 研究目的与意义(文献综述)

人体动作是计算机视觉和模式识别领域的热门研究课题之一,具有非常广泛的应用价值。人体动作识别在公共环境下的智能监控、基于视觉的人机交互和体感游戏等方面都具有巨大的应用潜力。但是由于人体是个复杂的非刚性结构体,其姿势和外观具有多变性,提高人体动作识别的准确性和稳健性仍然是一个具有难度的挑战,同时人体动作图像中存在遮挡、光照、姿态变化等问题一定程度上限制了人体动作识别技术的发展。

近些年,以设计通用性强、简单、高效的字典学习算法为目标[6]的字典学习方法迅猛发展,基于综合模型的约束字典[7]、在线字典[11]、结构字典[13]等在数据或字典结构上添加约束提升了字典学习的效率。字典学习模型也不再局限于综合稀疏模型,解析模型、盲字典模型、信息复杂度模型等在分析问题的角度、“简单性”度量等方面拓展了综合稀疏模型,使得字典学习模型更加多元化。基于新型模型的字典学习方法丰富了字典学习理论,扩充了应用范围。

人体动作识别的框架通常可以分为两个部分:动作表示的特征提取部分和动作模式的分类部分。人体动作的特征提取方法通常可以分为基于全局表示的方法和基于局部表示的方法。随着时代的发展,关于人体动作识别的研究也在逐步地发展,对计算机视觉领域提出了一些新的挑战。从早期受限条件下简单动作识别逐步转向了真实自然场景下复杂动作识别;从对单人动作识别的研究自然地过渡到对交互动作甚至是大规模群体动作识别的研究。人体动作识别技术由于其具有很强的应用价值和经济价值,近些年来该技术受到了国内外各科研机构和企业单位的重视。经过多年的研究和发展,人体动作识别技术已经取得了一些很重要的研究成果,并且成功的应用于智能监控、运动分析、感知接口以及军事目标识别等领域当中。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

本课题基于字典学习进行人体动作识别,例如识别超市里顾客从进门、看商品、拿起物品、付款、走出超市大门等一系列动作。

稀疏编码具有强大的信号表示能力,已经成为了信号处理和计算机视觉的一个研究热点。给定一个过完备的训练集,对于一个新来的测试样本y,它可以用训练样本的一个稀疏线性组合来表示。稀疏表示的目标是在求解线性表示或逼近最佳线性重构的同时使得表示系数尽量稀疏。字典学习的目标是直接从数据y学习一个用于稀疏表示的过完备字典x。它在保持系数矩阵b的每一列稀疏的同时,从数据y中产生过完备字典x。

人体动作识别的框架通常可以分为两个部分:动作表示的特征提取部分和动作模式的分类部分。人体动作的特征提取方法通常可以分为基于全局表示的方法和基于局部表示的方法。基于全局表示的特征提取方法直接在整个视频上提取特征,不考虑人体动作的动态信息。基于局部表示的特征提取则从视频中提取局部特征的时间序列。常用的局部特征包括人体外观表示、兴趣点、空时兴趣点和空时体体积[15]等。我们可以基于动作形状分析和局部保留投影的动作特征提取方法来进行人体动作识别,通过学习动作形状字典对人体动作进行识别。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。

第4-5周:熟悉掌握基本理论,完成英文资料的翻译,熟悉开发环境。

第6-10周:编程实现各算法,并进行仿真调试。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] l liu,l shao,f zheng,x li. realistic action recognition via sparsely-constructed gaussian processes. pattern recognition, 2014, 47(12):3819–3827.

[2] cheriyadat, anil m. unsupervised feature learning for aerial scene classification. ieee transactions on geoscience amp; remote sensing. 2014, 52(1):439-451.

[3] zhu, fan; shao, ling. weakly-supervised cross-domain dictionary learning for visual recognition. international journal of computer vision, 2014, 109(1):42-59.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图