近日,公司赵勇副教授课题组在计算机视觉顶级会议CVPR2020上发表题为: “Salience-Guided Cascaded Suppression Network for Person Re-identification” 和“One-Shot Adversarial Attacks on Visual Tracking With Dual Attention” 的学术论文2篇。
利用注意力机制对全局和局部特征进行建模,作为最终的行人表征,已成为行人再识别(Re-ID)算法的主流趋势。这些方法潜在的局限性是,它们侧重于提取最突出的特征(显著性特征),但重新识别一个人可能依赖于不同情况下显著性特征所掩盖的各种其他的线索。为了解决这一局限性,论文“Salience-Guided Cascaded Suppression Network for Person Re-identification”提出了一种新的显著性引导级联抑制网络(SCSN),该网络使模型能够挖掘多样化的显著性特征,并通过级联的方式将这些特征集成融合到最终的特征表示中。该文的主要贡献是提出了显著性信息引导的特征级联抑制策略,基于设计的显著特征提取单元(SFE Unit),该策略使网络能够逐级挖掘被最显著特征掩盖的各种潜在的、有用的特征,并将所提取的特征逐级融合,克服了网络倾向于仅学习最显著性特征这一局限性。实验结果表明,该方法在四个大规模数据集上的性能优于已有方法。
上图:提出的SCSN框架图
上图:提出的SFE单元详细结构
在计算机视觉中几乎所有的对抗性攻击都是针对已知的目标类别,针对这些目标类别可以离线训练以产生扰动,但是对于目标跟踪算法来说,被跟踪的目标类别通常是事先未知的。与此同时,跟踪算法也存在被攻击的潜在风险,用以躲避智能监视系统。对目标跟踪的对抗攻击是一项具有挑战性的任务,为此,论文“One-Shot Adversarial Attacks on Visual Tracking With Dual Attention”提出了一种仅依靠单张初始帧图像的方法来生成针对目标跟踪任务的对抗实例,即通过在初始帧目标块上加上微小的扰动,导致基于孪生网络的先进跟踪器在后续帧中丢失目标。具体来说,该攻击方法采用了两种结合注意力机制的攻击策略,第一个部分针对高质量的候选框产生扰动,使得网络降低对高质量候选框的执行度的同时提升对低质量候选框的置信度,而第二个部分则采用通用性的特征扰动策略,保证扰动的泛化性与鲁棒性。实验结果表明,该文的方法可以在三个标准数据集上显著降低被攻击算法的精度。
上图:模型整体框架图
CVPR作为国际上最高级别的计算机视觉会议,每年吸引学术界大牛、工业界最领先的AI相关企业、以及科技风投等大量人员参会,2019年参会人数接近上万人。今年投稿文章多达一万多篇,最终只录用1470多篇。
课题组内硕士陈雪松为2篇论文的第一作者,论文“Salience-Guided Cascaded Suppression Network for Person Re-identification”由北大深研院、腾讯优图和南方科技大学联合完成,论文“One-Shot Adversarial Attacks on Visual Tracking With Dual Attention”由北大深研院、清华大学和南方科技大学等共同完成。
(供稿:12bet登录入口赵勇副教授课题组)