南京泉峰集团办公楼设计文献综述
2020-05-05 16:47:51
文 献 综 述 近年来, 被广泛关注的深度学习算法已经被成功运用于语音识别、图形识别等各个领域. 深度学习理论在静态图像特征提取上取得了卓著成就, 并逐步推广至具有时间序列的视频行为识别研究中。
[1] 人体行为识别因为其广泛的应用而成为一个热点研究领域[2],包括人机交互、异常行为检测[3]等等。
行为识别的关键是对具有强烈描述能力的行为特征的提取, 早期的对特征提取而手动设计的特征,例如HOG/HOF[4]、HOG3D[5]等通常都是通过特定的目的进行设计的, 由于通常它都是对于固定的数据集进行设定的,因此可能无法适应现实世界中的很多场景。
即使对于选择特征和方法进行手动辅助的情况下,由于真实场景的复杂,复杂的光照条件等从而使精确的行为识别仍是一个具有挑战性的任务。
由于直接从数据中学习特征比手动特征更具有泛化性,因而从数据中学习特征成为一个可行的解决方案。
[6] 在深度学习的诸多模型中, 受重视最多的就是被用在大规模图像识别任务中的卷积神经网络[7](Convolutional Neural Nets,CNN), 简称ConvNets。
杨天明等[8]为利用视频中的空间信息和时间信息来识别人物行为动作,提出一种时空双流视频人物动作识别模型。
Manh-Quan Bui等[9]将卷积神经网络 (cnn) 模型与主成分分析 (pca) 进行了合理的组合。
循环神经网络(Recurrent Neural Networks,RNNs)由于其对于时间建模上的优越性,已经在众多自然语言处理[10](NaturalLanguage Processing,NLP)中取得了巨大成功以及广泛应用。
由于梯度的爆发与消失问题,标准的RNN 在长序列学习中存在很多问题。