自动化-学科-FmRead学术前沿

关于领域自适应语义分割的新视角：T2S-DA研究背景与研究意义语义分割在计算机视觉领域中具有重要的应用，但其性能往往依赖于大量标注数据。然而，标注数据的获取成本极高，特别是在复杂场景中，为此，许多研究转向利用合成数据来缓解标注需求的问题。然而，由于领域间的差异性（domain gap），基于合成数据训练的模型难以泛化到真实场景中。这种情况下，无监督领域适应（Unsupervised Domain Adaptation, UDA）方法成为解决此问题的有效手段，其目标是从标注的源域（source domain）迁移知识到未标注的目标域（target domain）。传统的UDA方法主要分为两类：对抗训练和自训练。对抗训练通过分布对齐来缩小领域间的差异，而自训练则利用目标域的伪标签进行直接监...

深度学习解释性研究：基于扰动的归因图评估方法背景和研究动机随着深度学习模型在各种任务中取得显著成功，人们越来越关注这些模型的解释性和透明性。然而，尽管模型在准确性上表现卓越，其决策过程的可解释性仍然存在很大不足。这种不足限制了模型在实际应用中的推广，因为许多场景需要模型不仅能提供准确的预测，还需具备鲁棒性、不确定性估计以及对决策过程的直观解释能力。在计算机视觉领域，归因方法（Attribution Methods）被广泛应用于神经网络的解释性研究。这些方法通过生成归因图（Attribution Maps，AMs），显示输入图像中哪些区域对模型的决策贡献最大。然而，由于归因图的定性特性，如何定量评估这些图的有效性仍是一个未解决的问题。本研究旨在解决归因图评估中面临的可靠性和一致性问题，为...

Transformer for Object Re-Identification: A Survey 背景与研究意义对象重新识别（Object Re-Identification，简称Re-ID）是一项重要的计算机视觉任务，旨在跨时间和场景识别特定对象。这一领域在深度学习技术的推动下取得了显著进展，尤其是基于卷积神经网络（Convolutional Neural Networks，简称CNNs）的研究。然而，随着视觉Transformer的出现，Re-ID研究开启了新的篇章。本文综述了基于Transformer的Re-ID技术，分析其在图像/视频、少数据/少标注、多模态及特殊应用场景中的优势与挑战。研究团队与发表信息本文由来自武汉大学、Sun Yat-Sen University和In...

专题报道：Pound–Drever–Hall 前馈技术：超越反馈的激光相位噪声抑制作者: Yu-Xin Chao, Zhen-Xing Hua, Xin-Hui Liang, Zong-Pei Yue, Li You, Meng Khoon Tey 机构: State Key Laboratory of Low-Dimensional Quantum Physics, Department of Physics, Tsinghua University, Beijing, China 期刊: Optica 发表日期: 2024年7月9日 DOI链接: 点击这里一、研究背景在过去的几十年中，频率锁定到超稳光学参考腔的窄线宽激光器的出现，开创了引力波探测、光学钟、超低噪声光子微波生成、高保...

科学数据报道 | K-emophone: 一种带有原地情绪、应激和注意力标签的移动和可穿戴数据集背景介绍随着低成本移动和可穿戴传感器的普及，许多研究已经利用这些设备来跟踪和分析人类的心理健康、生产力以及行为模式。然而，迄今为止，尽管在实验室环境下采集的数据集已有所发展，仍存在缺少在真实世界情境中采集到情绪、应激和注意力等标签的数据集，这限制了情感计算 (Affective Computing) 和人机交互 (Human-computer Interaction) 领域的研究进展。研究来源本文的研究由Soowon Kang、Woohyeok Choi、Cheul Young Park、Narae Cha、Auk Kim、Ahsan Habib Khandoker、Leontios Ha...

从目标到源：域自适应语义分割的新视角

卷积神经网络中归因图可靠性的扰动评估方法

基于Transformer的对象再识别综述

Pound–Drever–Hall前馈：超越反馈的激光相位噪声抑制

k-emophone: 包含情绪、压力和注意力标签的移动和可穿戴数据集