电子信息-学科-FmRead学术前沿

高效图像去雨方法：基于雨混合增强的高效深度去雨网络背景介绍降雨会对计算机视觉系统捕获的图像和视频质量产生显著影响，如雨滴和雨线会导致图像清晰度下降，进而影响行人检测、目标跟踪和语义分割等任务。为实现全天候视觉系统，图像去雨成为一个关键需求。然而，现有去雨方法通常基于雨模型的启发式假设，这种方法需要复杂的优化或迭代求解，从而导致计算开销大、实时性差。此外，这些假设往往无法涵盖真实雨景复杂多样的模式，制约了去雨质量。为解决上述问题，本文提出了一种高效的图像去雨方法 EfficientDeRain+，通过将去雨问题建模为预测滤波问题，并设计了一系列创新技术，包括不确定性感知级联预测滤波、多尺度扩张滤波，以及数据增强方法 RainMix，显著提升了图像去雨的效率和质量。论文来源本文由来自新...

基于可见光和红外跨模态学习的Adaptive Middle-Modality Alignment Learning方法研究研究背景与问题在智能监控系统的需求推动下，可见光-红外行人再识别（Visible-Infrared Person Re-identification, VIReID）正逐渐成为一个备受关注的研究领域。该任务旨在通过对不同光谱模态（如可见光与红外）的行人图像进行匹配，实现全天候行人识别。由于可见光和红外图像源自不同的光谱，存在显著的模态差异，包括光照、纹理、颜色等，这使得跨模态匹配成为一大挑战。传统方法多通过设计复杂的生成对抗网络（Generative Adversarial Networks, GANs）或深度网络模型来缩小模态差异，但这些方法通常存在如下问题： -...

基于弱监督的协作式程序对齐框架：在指令视频相关性学习中的应用与评估近年来，随着视频分析领域的快速发展，指令视频因其目标驱动的特性和与人类学习过程的内在关联，吸引了研究者越来越多的关注。相比于普通视频，指令视频包含多个细粒度的步骤，这些步骤具有不同的持续时间和时间位置，形成了更加复杂的程序结构。本研究提出了一种名为协作式程序对齐（Collaborative Procedure Alignment, CPA）的弱监督框架，用于在指令视频中进行程序感知的相关性学习。这一框架的核心特点在于无需依赖昂贵的步骤级标注，通过协作提取步骤信息并量化视频间的程序相关性，显著提升了指令视频相关性学习的效率和效果。研究背景与问题提出指令视频相关性学习（Video Correlation Learning, ...

One-shot Generative Domain Adaptation in 3D GANs 近年来，生成式对抗网络（Generative Adversarial Networks, GANs）在图像生成领域取得了显著进展。传统的二维生成模型已经能够在多种任务中展现出极高的能力。然而，将这一技术扩展到三维领域（3D-aware image generation），以同时生成二维图像并学习三维结构，仍然面临诸多挑战。本文报道了发表在 International Journal of Computer Vision 上的一篇题为《One-shot Generative Domain Adaptation in 3D GANs》的文章。该研究由 Ziqiang Li、Yi Wu、Chaoyue...

深度学习解释性研究：基于扰动的归因图评估方法背景和研究动机随着深度学习模型在各种任务中取得显著成功，人们越来越关注这些模型的解释性和透明性。然而，尽管模型在准确性上表现卓越，其决策过程的可解释性仍然存在很大不足。这种不足限制了模型在实际应用中的推广，因为许多场景需要模型不仅能提供准确的预测，还需具备鲁棒性、不确定性估计以及对决策过程的直观解释能力。在计算机视觉领域，归因方法（Attribution Methods）被广泛应用于神经网络的解释性研究。这些方法通过生成归因图（Attribution Maps，AMs），显示输入图像中哪些区域对模型的决策贡献最大。然而，由于归因图的定性特性，如何定量评估这些图的有效性仍是一个未解决的问题。本研究旨在解决归因图评估中面临的可靠性和一致性问题，为...

EfficientDeRain+: 基于RainMix增强的不确定性感知学习滤波的高效去雨

自适应中间模态对齐学习用于可见光-红外人体重识别

面向程序感知的弱监督协作程序对齐框架研究

基于三维生成对抗网络的一次性生成域适应

卷积神经网络中归因图可靠性的扰动评估方法