Anti-Fake Vaccine:通过视觉-语义双重退化保护隐私免受换脸攻击

深度伪造与面部隐私保护:Anti-Fake Vaccine的创新研究 背景与研究动机 近年来,深度伪造(Deepfake)技术的发展对个人隐私和社会安全构成了严峻挑战。作为深度伪造技术的一个典型应用,面部替换技术广泛应用于电影制作和计算机游戏,但其潜在风险也愈发显著。面部替换可以将源人脸的身份信息嵌入目标人脸,从而生成具有欺骗性、逼真的合成图像或视频。这种技术的普及使不法分子可以轻松生成未经授权的伪造内容,对受害者的声誉和安全造成重大威胁。 现有防御技术主要分为两类:被动防御(通过检测伪造内容)和主动防御(通过添加干扰来阻止伪造)。然而,主动防御技术在面对复杂的面部替换场景时表现欠佳,尤其是由于身份信息转移涉及更复杂的语义特征提取和合成过程。针对这一问题,Jingzhi Li等人提出了名为“...

基于少量标注像素和点云的弱监督驾驶场景语义分割

基于少量像素标注与点云数据的驾驶场景弱监督语义分割 背景与研究问题 语义分割作为计算机视觉的重要任务之一,在自动驾驶等领域具有广泛应用。然而,传统的全监督语义分割方法需要大量的像素级标注,标注成本高昂。在弱监督语义分割(Weakly Supervised Semantic Segmentation, WSSS)中,通过较少的粗粒度标注(如图片标签、边框、点级标注等)实现像素级分割,极大地降低了标注成本。 现有的WSSS方法大多基于CAM(类激活图)生成初始分割种子,但在复杂的驾驶场景中,这种方法表现不佳。驾驶场景中的图像通常包含多种物体类别,且类别间的遮挡、重叠问题严重,导致现有基于图片标签的WSSS方法难以达到高精度分割效果。 针对这些问题,本研究提出了一种结合少量点标注和点云数据的新型W...

重新思考用于生物识别数据错误校正的当代深度学习技术

重新思考深度学习技术在生物特征数据纠错中的应用 背景介绍 随着信息技术的发展,生物特征数据在身份验证和安全存储中的应用愈发广泛。传统密码学通常依赖均匀分布且可精确重现的随机字符串,然而,现实中大多数数据(如指纹、虹膜扫描等生物特征)并不具备这样的属性,导致在实际应用中存在生成、存储和检索的诸多挑战。近年来,基于生物特征数据的密码学系统(biometric cryptosystems)被广泛研究,旨在利用独特的生物特征(例如指纹、虹膜等)作为生成加密密钥的来源。然而,由于生物特征数据的固有可变性以及传感器噪声等外部因素,精确恢复加密密钥变得复杂,进而对纠错机制提出了更高的要求。 在这种背景下,近年来深度学习方法凭借其在语音识别、图像处理等领域的卓越表现,被尝试应用于提升生物特征数据的纠错能力。...

日夜兼容的伪监督活动识别方法

研究亮点:基于伪监督和适应性音视频融合的低光照活动识别 学术背景 本文主要探讨在低光照环境中识别活动的挑战。现有的活动识别技术在光照充足的条件下表现优异,但面对低光照视频时却常常失效。这种局限性主要源于两个原因:一是缺乏带标注的低光照训练数据,二是低光照环境下视频的颜色对比度降低,导致视觉信息损失。此外,传统的基于视频图像增强的解决方案,尽管在一定程度上改善了图像质量,但常因引入颜色失真和视频帧不连续性等问题,对活动识别任务产生负面影响。 低光照活动识别在多个应用领域具有重要意义,包括智能家居、自主驾驶、安全监控以及野生动物观察等。因此,本文作者提出了一种新的方法,通过结合伪监督学习和自适应音视频融合技术,显著改善低光照环境下的活动识别性能。 研究来源 这项研究由University of ...

EfficientDeRain+: 基于RainMix增强的不确定性感知学习滤波的高效去雨

高效图像去雨方法:基于雨混合增强的高效深度去雨网络 背景介绍 降雨会对计算机视觉系统捕获的图像和视频质量产生显著影响,如雨滴和雨线会导致图像清晰度下降,进而影响行人检测、目标跟踪和语义分割等任务。为实现全天候视觉系统,图像去雨成为一个关键需求。然而,现有去雨方法通常基于雨模型的启发式假设,这种方法需要复杂的优化或迭代求解,从而导致计算开销大、实时性差。此外,这些假设往往无法涵盖真实雨景复杂多样的模式,制约了去雨质量。 为解决上述问题,本文提出了一种高效的图像去雨方法 EfficientDeRain+,通过将去雨问题建模为预测滤波问题,并设计了一系列创新技术,包括不确定性感知级联预测滤波、多尺度扩张滤波,以及数据增强方法 RainMix,显著提升了图像去雨的效率和质量。 论文来源 本文由来自新...

自适应中间模态对齐学习用于可见光-红外人体重识别

自适应中间模态对齐学习用于可见光-红外人体重识别

基于可见光和红外跨模态学习的Adaptive Middle-Modality Alignment Learning方法研究 研究背景与问题 在智能监控系统的需求推动下,可见光-红外行人再识别(Visible-Infrared Person Re-identification, VIReID)正逐渐成为一个备受关注的研究领域。该任务旨在通过对不同光谱模态(如可见光与红外)的行人图像进行匹配,实现全天候行人识别。由于可见光和红外图像源自不同的光谱,存在显著的模态差异,包括光照、纹理、颜色等,这使得跨模态匹配成为一大挑战。 传统方法多通过设计复杂的生成对抗网络(Generative Adversarial Networks, GANs)或深度网络模型来缩小模态差异,但这些方法通常存在如下问题: -...