InA: 在预训练语言模型上的抑制自适应方法

InA: 在预训练语言模型上的抑制自适应方法 预训练语言模型(Language Models, LMs)已经在自然语言处理(Natural Language Processing, NLP)任务中取得了显著的效果。然而,传统的微调方法存在冗余参数的问题,影响了效率和效果。为了应对这一挑战,本文提出了一种称为抑制自适应(Inhibition Adaptation, INA)的微调方法,用以减少添加的可调权重,并适当地再权重来自预训练语言模型的知识。 研究背景和问题 当前,微调预训练语言模型是一种常见的解决NLP下游任务的方法。然而,经典的微调方法需要更新所有的模型参数,这会导致冗余参数问题,尤其是当应用于新的下游任务时。冗余参数不仅影响模型的效率,还会阻碍模型性能的提升。为了解决这一问题,已有...

异质共存吸引子、大尺度幅度控制和中央循环忆阻神经网络的有限时间同步

异质共存吸引子、大尺度幅度控制和中央循环忆阻神经网络的有限时间同步 学术背景 忆阻器因其类似大脑突触的记忆性和非线性等物理特性,在类脑神经网络的混沌动力学研究中具有巨大理论和实际意义。近年来,随着大数据和人工智能领域的发展,传统的固定神经网络模型在映射大脑结构和功能上的局限性逐渐显现,这成为形态神经学研究进一步发展的主要障碍。自2008年HP实验室首次发展出物理非线性忆阻器以来,忆阻器在人工神经网络领域受到了广泛关注。忆阻神经网络(Memristive Neural Networks, MNNs)的构建对于研究人脑结构与功能之间的关系、分析人脑神经系统机制、以及增强人工智能决策、优化自适应控制和加速硬件计算都是极其重要的。 论文来源 这篇文章《Heterogeneous Coexisting...

适应性识别和优化不良区域以实现准确的立体匹配

适应性识别和优化不良区域以实现准确的立体匹配

适应性识别和优化不良区域以实现准确的立体匹配 研究背景和动机 随着计算机视觉技术的快速发展,立体匹配技术因其高准确性、成本效益及非侵入性,在机器人、航天、自动驾驶和工业制造等诸多领域中发挥了至关重要的作用。然而,立体匹配在处理遮挡区域、模糊区域时,像素对之间的一致性约束变得不可靠,导致隐藏对应关系探索的困难。因此,尽管在卷积神经网络(CNN)和基于变换器(Transformer)的研究进展迅速,多数方法在处理不良区域时仍存在性能瓶颈。为了应对这一挑战,研究团队引入了一种误差区域特征优化机制以提供上下文特征,从而改进不良区域的立体匹配效果。 研究来源和简介 本文题为”Adaptively Identify and Refine Ill-Posed Regions for Accurate St...

使用模型投影的联邦学习进行多中心疾病诊断

使用模型投影的联邦学习进行多中心疾病诊断

使用模型投影的联邦学习进行多中心疾病诊断 背景介绍 随着医学影像技术的快速发展,基于自动化诊断方法的研究在单中心数据集上表现出良好的性能。然而,这些方法在实际应用中往往难以泛化到其他医疗机构的数据。主要原因是这些方法通常假设不同医疗中心的数据是独立同分布(IID)的,而实际上不同中心由于使用不同的扫描仪和成像参数,导致数据分布非独立同分布(Non-IID)。此外,不同中心诊断的患者数量和种类也存在较大差异。因此,多中心的数据具有异质性,无法通过集中化学习(Centralized Learning)有效解决这一问题。 近年来,联邦学习(Federated Learning,FL)作为一种去中心化框架,为多中心协同训练全球模型提供了可能,同时还保留了各中心患者数据的隐私。然而,Non-IID数据...

自适应采样人工实际控制在约束系统非零和博弈中的应用

自适应采样人工实际控制在约束系统非零和博弈中的应用 背景 在现代工业和科研领域中,智能技术和控制系统的迅速发展,使得传统的控制方法难以满足保证系统稳定性和最小化能耗的严格要求。实际系统通常非常复杂,至少包含两个控制单元,并存在组件之间错综复杂的竞争与合作关系。这种情况下,设计的控制方案不仅要考虑单个控制器的效益最大化,还要实现全局优化。这类问题通常被视为非零和博弈(Non-Zero-Sum Games,NZSG),在多物理输入约束条件下,处理系统耦合动态是一个重要的研究难题。 论文来源 本文题为《Adaptive Sampling Artificial-Actual Control for Non-Zero-Sum Games of Constrained Systems》由Lu Liu和R...

多尺度视觉中枢引导的多模态神经机器翻译:文本感知的跨模态对比解耦

多尺度视觉中枢引导的多模态神经机器翻译:文本感知的跨模态对比解耦

多尺度视觉中枢引导的多模态神经机器翻译:文本感知的跨模态对比解耦 学术背景 多模态神经机器翻译(Multi-Modal Neural Machine Translation, MNMT)旨在将语言无关的视觉信息引入文本以提升机器翻译的性能。然而,由于图像和文本在模态上的显著差异,这两者之间不可避免会出现语义不匹配的问题。解决这些问题的目标在于通过使用分解的多尺度视觉信息作为跨语言中枢,提高不同语言之间的对齐,从而改进MNMT的表现。 论文来源 这篇论文由朱俊俊、苏瑞和叶俊杰等研究人员撰写,作者分别来自昆明理工大学信息工程与自动化学院、云南大学信息科学与工程学院以及云南省人工智能重点实验室。论文将在2024年发表于著名期刊”Neural Networks”。 研究流程 研究工作主要分为以下几个...