会议专题

基于深度学习的视频中动作识别方法研究综述

  近年来,计算机视觉技术迅速发展,行为识别作为计算机视觉的任务之一,成为了研究热点。当前,基于深度学习动作识别的算法层出不穷。传统的二维卷积网络虽然计算成本相对较低,但是难以捕捉时序信息。对于行为识别任务,视频中的时序信息是非常重要的。三维卷积有效解决了时间维度的问题,但是维度的增加同样带来了相当大的计算量。本文针对当前主流的双流卷积网络、三维卷积网络等方法进行对比总结,讨论了行为识别方法存在的一些问题,并提出了对未来发展方向的展望。

计算机视觉 动作识别 双流法 3D卷积

于海港 何宁 刘圣杰

北京联合大学北京市信息服务工程重点实验室 北京100101

国内会议

中国计算机用户协会网络应用分会2021年第二十五届网络新技术与应用年会

北京

中文

211-215

2021-11-01(万方平台首次上网日期,不代表论文的发表时间)