近日,学院刘博老师多模感知与融合计算团队题为“Hierarchical Spatio- Temporal Representation Learning for Gait Recognition”的研究论文被计算机视觉领域顶级国际会议International Conference on Computer Vision (ICCV) 2023录用,实现了5845cc威斯尼斯人官网版在该会议上的首次突破。论文第一作者为学院2021级硕士王雷,指导教师刘博为通信作者。该研究成果得到国家自然科学基金 (61972132,62106065)、5845cc威斯尼斯人官网版自主培养人才计划 (PY201810) 等项目的资助。
ICCV是由IEEE主办的计算机视觉领域顶级会议,与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议,中国计算机学会 (CCF) 推荐A类会议,在业内具有极高的评价。ICCV在世界范围内每两年召开一次,2021、2023年论文录取率分别为25.9%,26.7%。该会议在2022年Google学术期刊和会议影响力排名总榜第十七位。
步态识别是一种通过个体独特的行走方式进行生物识别的技术,适用于无约束的环境,具有广泛的应用场景。虽然当前方法多数使用基于身体部件的表示,但它们往往忽略了局部运动模式之间的层次依赖性。该研究提出了一种用于步态识别的层次时空表示学习 (HSTL) 框架。HSTL堆叠多个基于自适应区域的运动提取器 (ARME ) ,并以由粗到细的方式学习步行模式,同时提出了一种自适应时空池化 (ASTP) 模块,用于对各级ARME的输出进行层次特征映射。此外,基于融合时间信息来压缩局部子序列,设计了一个帧级时间聚合模块 (FTA) 。通过在四个公共数据集 (CASIA-B、OUMVLP、GREW和Gait3D) 的实验,验证了所提出HSTL框架的有效性。
图 1 模型框架图
图 2 模型在性能和计算复杂度上取得权衡
近年来,刘博所在的多模感知与融合计算团队,始终专注于人工智能基础算法理论研究与智慧农业交叉领域的应用研究。目前,该团队成员承担国家自然科学基金项目2项,省自然科学基金项目4项,省重点研发计划项目3项;在CCF A类期刊、A类会议及中国科学院二区TOP及以上期刊发表论文20余篇。