视频人体动作识别一直是具有重要学术价值的研究领域。在传统方法中,动作特征和轨迹特征效果最为优秀,改进密集轨迹( Improved Dense Trajectories,IDT)特征在HMDB-51动作库上就可以达到57. 2%的准确率,融合了IDT特征的组合特征可以在UCFI01动作库上达到89. 62%的准确率。而只用了图像RGB数据的空域卷积网络模型仅能分别做到40. 5%和73. 0%。
为将卷积神经网络( CNN)应用到视频理解中,提出一种基于训练图CNN特征的识别算法。利用图像RGB数据识别视频人体动作,使用现有的CNN模型从图像中提取特征,并采用长短记忆单元的递归神经网络进行训练分类,研究CNN模型和隐层的选择、优化、特征矢量化和降维。实验结果表明,与使用图像RGB数据注意力模型的算法和组合长短期记忆模型算法相比,该算法具有更高的准确率。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !