深度学习-术语-FmRead学术前沿

在计算机视觉领域，行人重识别（Person Re-Identification, Re-ID）是一项重要的任务，旨在通过不同时间和地点的非重叠摄像头捕捉的图像或视频，匹配同一个人的身份。随着监控系统在公共安全中的广泛应用，Re-ID技术成为了视觉监控中的关键环节。然而，Re-ID任务面临着诸多挑战，尤其是在长期行人重识别（Long-Term Person Re-Identification, LT-ReID）中，由于时间跨度较长，行人的服装可能会发生完全、部分或不变的变化，这给传统的Re-ID方法带来了极大的困难。传统的LT-ReID方法主要分为两类：基于生物特征的方法和基于数据适应的方法。前者依赖于生物特征（如步态、体型、面部特征等）来应对服装变化，但在复杂背景或数据不完整的情况下表现不...

学术背景与问题提出随着深度神经网络（Deep Neural Networks, DNNs）的快速发展，视觉智能系统在图像分类、目标检测、视频理解等任务中取得了显著进展。然而，这些突破依赖于高质量标注数据的收集，而标注过程通常耗时且昂贵。为了应对这一问题，研究人员开始利用大规模的网络数据进行训练，但这些数据往往带有噪声标签（label noise），这会影响深度神经网络的性能。噪声标签的存在会导致训练数据和测试数据分布不一致，从而影响模型在干净测试数据上的泛化能力。为了解决这一问题，样本选择（sample selection）成为一种有效的方法。其核心思想是通过某种标准从所有训练样本中分离出干净的样本。以往的方法主要依赖于“小损失准则”（small loss criterion），即认为损...

基于生成模型的无人机行为意图识别：从行为到自然语言的跨模态研究背景及研究目标近年来，无人机（Unmanned Aerial Vehicle，UAV）技术取得飞速发展，广泛应用于民用与军事领域，如搜索救援、农业精准作业和通信中继等。然而，随着无人机群规模的扩大以及智能化水平的提升，空中指挥与控制领域对于更高水平的智能需求日益迫切。在复杂的对抗环境中，提高无人机的“态势感知”（situation awareness）水平已然成为关键问题，尤其是如何有效识别无人机的操作意图。这一识别过程有助于揭示对手操作意图与战术欺骗间的关系，优化信息在指挥层级中的流动，并为决策提供指导。传统基于分类任务的意图识别方法受到数据库分布失衡和鲁棒性差等问题的限制，导致分类精度难以应用于现实复杂场景。本研究提出了...

提升无人机目标检测的选择性频域交互网络研究背景及问题提出随着计算机视觉技术的发展，无人机目标检测已成为遥感领域的重要研究方向之一。无人机目标检测旨在从倾斜拍摄和高度多变的航拍图像中识别出诸如车辆、建筑物等目标。这一技术在环境监测、灾害管理以及安全监控等领域具有广泛应用。然而，受目标尺度、方向以及复杂背景的影响，无人机目标检测面临诸多挑战，包括目标间密集分布、光照差异和视角变化等问题。当前大多数基于卷积神经网络（Convolutional Neural Networks, CNN）的解决方案主要注重空间和通道交互，忽视频域信息的重要性。频域信息对于捕捉对象的纹理、边缘等特定特征具有不可替代的作用，然而，现有的权重分配方法，例如通道注意力机制，难以完全利用频域信息，往往导致信息丢失。这种不...

基于扩散模型的特征增强：针对全视野病理图像多实例学习的新方法学术背景与研究动机在计算病理学（computational pathology）领域，如何有效分析全视野扫描病理图像（Whole Slide Images，WSIs）是当前研究的热点。WSIs 是超高分辨率的图像，通常具有广域的视野，广泛用于癌症诊断。然而，由于病例标记的稀缺性以及图像自身的体量庞大，基于深度学习的多实例学习（Multiple Instance Learning，MIL）在WSI的自动化分析中面临诸多挑战。 MIL 是一种经典的弱监督学习方法，核心思路在于将整个WSI看作一个“袋”级别的实例，而每块小图像（patch）作为单独的“袋中实例”。虽然袋级别的标签已知，但单个实例的标签未知。在 MIL 的应用中，常见的...

基于服装状态感知的长期行人重识别特征正则化网络

利用通用代理模型进行样本选择来应对标签噪声

从行为到自然语言：无人机意图识别的生成方法

基于选择性频率交互网络的航空目标检测增强

基于扩散模型的特征增强在整张切片图像多实例学习中的应用