EfficientDeRain+: 基于RainMix增强的不确定性感知学习滤波的高效去雨

高效图像去雨方法:基于雨混合增强的高效深度去雨网络 背景介绍 降雨会对计算机视觉系统捕获的图像和视频质量产生显著影响,如雨滴和雨线会导致图像清晰度下降,进而影响行人检测、目标跟踪和语义分割等任务。为实现全天候视觉系统,图像去雨成为一个关键需求。然而,现有去雨方法通常基于雨模型的启发式假设,这种方法需要复杂的优化或迭代求解,从而导致计算开销大、实时性差。此外,这些假设往往无法涵盖真实雨景复杂多样的模式,制约了去雨质量。 为解决上述问题,本文提出了一种高效的图像去雨方法 EfficientDeRain+,通过将去雨问题建模为预测滤波问题,并设计了一系列创新技术,包括不确定性感知级联预测滤波、多尺度扩张滤波,以及数据增强方法 RainMix,显著提升了图像去雨的效率和质量。 论文来源 本文由来自新...

自适应中间模态对齐学习用于可见光-红外人体重识别

自适应中间模态对齐学习用于可见光-红外人体重识别

基于可见光和红外跨模态学习的Adaptive Middle-Modality Alignment Learning方法研究 研究背景与问题 在智能监控系统的需求推动下,可见光-红外行人再识别(Visible-Infrared Person Re-identification, VIReID)正逐渐成为一个备受关注的研究领域。该任务旨在通过对不同光谱模态(如可见光与红外)的行人图像进行匹配,实现全天候行人识别。由于可见光和红外图像源自不同的光谱,存在显著的模态差异,包括光照、纹理、颜色等,这使得跨模态匹配成为一大挑战。 传统方法多通过设计复杂的生成对抗网络(Generative Adversarial Networks, GANs)或深度网络模型来缩小模态差异,但这些方法通常存在如下问题: -...

面向程序感知的弱监督协作程序对齐框架研究

基于弱监督的协作式程序对齐框架:在指令视频相关性学习中的应用与评估 近年来,随着视频分析领域的快速发展,指令视频因其目标驱动的特性和与人类学习过程的内在关联,吸引了研究者越来越多的关注。相比于普通视频,指令视频包含多个细粒度的步骤,这些步骤具有不同的持续时间和时间位置,形成了更加复杂的程序结构。本研究提出了一种名为协作式程序对齐(Collaborative Procedure Alignment, CPA)的弱监督框架,用于在指令视频中进行程序感知的相关性学习。这一框架的核心特点在于无需依赖昂贵的步骤级标注,通过协作提取步骤信息并量化视频间的程序相关性,显著提升了指令视频相关性学习的效率和效果。 研究背景与问题提出 指令视频相关性学习(Video Correlation Learning, ...

基于三维生成对抗网络的一次性生成域适应

One-shot Generative Domain Adaptation in 3D GANs 近年来,生成式对抗网络(Generative Adversarial Networks, GANs)在图像生成领域取得了显著进展。传统的二维生成模型已经能够在多种任务中展现出极高的能力。然而,将这一技术扩展到三维领域(3D-aware image generation),以同时生成二维图像并学习三维结构,仍然面临诸多挑战。本文报道了发表在 International Journal of Computer Vision 上的一篇题为《One-shot Generative Domain Adaptation in 3D GANs》的文章。该研究由 Ziqiang Li、Yi Wu、Chaoyue...

卷积神经网络中归因图可靠性的扰动评估方法

深度学习解释性研究:基于扰动的归因图评估方法 背景和研究动机 随着深度学习模型在各种任务中取得显著成功,人们越来越关注这些模型的解释性和透明性。然而,尽管模型在准确性上表现卓越,其决策过程的可解释性仍然存在很大不足。这种不足限制了模型在实际应用中的推广,因为许多场景需要模型不仅能提供准确的预测,还需具备鲁棒性、不确定性估计以及对决策过程的直观解释能力。 在计算机视觉领域,归因方法(Attribution Methods)被广泛应用于神经网络的解释性研究。这些方法通过生成归因图(Attribution Maps,AMs),显示输入图像中哪些区域对模型的决策贡献最大。然而,由于归因图的定性特性,如何定量评估这些图的有效性仍是一个未解决的问题。本研究旨在解决归因图评估中面临的可靠性和一致性问题,为...