基于深度递归强化学习和联邦学习的工业物联网流量入侵检测方法

基于深度循环强化学习和联邦学习的工业物联网流量入侵检测方法 学术背景 工业物联网(Industrial Internet of Things, IIoT)的快速发展带来了智能工业系统的巨大变革,IIoT通过互联网连接各种工业设备,实现了设备间的数据交换、远程控制以及智能决策。然而,这种无缝连接和庞大的设备网络也使得工业系统面临日益复杂和多样化的网络安全威胁。在实际IIoT场景中,网络攻击可能导致数据泄漏、数据操纵、拒绝服务(denial of service, DoS)、以及工厂生产中断等严重后果。传统的入侵检测方法虽然对部分攻击类型表现出了一定的检测能力,但由于其大多采用传统的机器学习模型在集中服务器上训练,无法很好地处理分布式设备所带来的隐私、能耗以及异质性数据分布问题。 为了应对这些挑...

自适应复合固定时间强化学习优化的非线性系统控制及其在智能船舶自动驾驶上的应用

智能船舶自动驾驶的非线性固定时间强化学习优化控制研究 近年来,智能自动驾驶技术逐渐成为自动化控制领域的研究热点之一。在复杂的非线性系统中,优化控制策略的设计,尤其是在固定时间内实现系统稳定性和性能优化方面,是控制工程师和研究人员面临的重要挑战之一。然而,现有的固定时间控制理论在实现系统状态收敛时,往往忽略了资源利用效率和平衡问题,这可能导致过度补偿或欠补偿的现象,从而使系统的稳态误差增加。此外,对于如何在时间限定内实现非线性不确定性估计误差的最小化,相关研究依然较少。因此,本研究旨在提出一种自适应复合固定时间强化学习优化控制解决方案,进一步解决这一关键问题。 研究背景及目的 固定时间控制理论自提出以来,由于收敛时间不依赖于初始状态的特点,其应用得到了广泛关注。相比有限时间控制方法,固定时间控...

基于偏好预测的多目标演化优化在汽油调和调度中的应用

基于偏好预测的进化式多目标优化用于汽油调和调度 背景介绍 随着全球能源市场的不断变化,汽油的生产和调和工艺面临着越来越多的挑战。汽油作为石油工业的重要产品,其调和和调度过程直接影响产品的质量和生产效率。汽油调和需要根据产品规格和性能要求,将多种组分按不同比例混合,以生产不同等级的汽油。在此过程中,必须满足多项性能指标,例如辛烷值(Octane Number, ON)、里德蒸气压(Reid Vapor Pressure, RVP)、铅含量、硫含量及闪点等。这不仅要求严格的质量控制,还需符合日益严苛的环保法规。 汽油调和和调度本质上是一个多目标优化问题。此类问题具有多个相互冲突的目标,例如提高产品质量、最大化生产效率、减少设备占用率、以及尽量降低生产成本。此外,这一问题还涉及复杂的约束条件和非线...

meMIA:多级集成成员推理攻击

深入解析科研论文:MEMIA: Multilevel Ensemble Membership Inference Attack 科研背景介绍 随着数字技术的迅猛发展,人工智能(AI)和机器学习(ML)已经深入渗透到医疗、金融、零售、教育以及社交媒体等多个领域。然而,随着这些技术的广泛应用,隐私泄露的风险也愈发凸显。许多研究表明,机器学习模型容易受到对抗性攻击的威胁,其中一种重要的隐私攻击形式是会员推断攻击(Membership Inference Attack, MIA)。这种攻击的核心目的是通过分析目标模型的输出预测分布,推测某一特定数据样本是否被用于模型的训练。然而,目前已有的MIA方法面临诸多限制,尤其是在数据集类别较少或目标模型欠拟合的场景下,其攻击精度通常会显著下降。因此,如何提升...

RD-Net:通过视神经头的结构特征预测青光眼的残差-密集网络

使用残差密集网络 (RD-Net) 进行基于视神经头结构特征的青光眼预测 背景与研究目的 青光眼是全球范围内导致失明的主要原因之一,被称为“视力的无声窃贼”。其主要特征是视神经(Optic Nerve Head, ONH)的进行性损伤,可能在患者察觉到其视力受损之前已经造成不可逆转的视觉丧失。据统计,青光眼是继白内障之后的第二大致盲原因。早期对青光眼的筛查与准确诊断,对管理疾病进展及维持患者的视觉功能至关重要。 临床上,青光眼的诊断主要基于以下结构和功能性测试:眼内压(Intraocular Pressure, IOP)测量、视神经头的结构评估,以及视野检测。然而,视野检测通常需要昂贵的设备,难以普及到基层医疗机构。因此,通过分析视神经头的结构特征,例如杯盘比(Cup-to-Disc Rat...

基于策略共识的分布式确定性多智能体强化学习方法研究

基于策略共识的分布式确定性多智能体强化学习研究报告 强化学习(Reinforcement Learning, RL)近年来在诸多领域取得了显著突破,包括机器人学、智能电网和自动驾驶等。然而,在实际场景中,常常涉及到多智能体(Multi-Agent Reinforcement Learning, MARL)的协作学习问题。这类问题的核心挑战在于设计高效的多智能体协作强化学习算法,尤其是在受制于通信能力限制或隐私保护的情况下。目前,多数的MARL算法依赖一种被广泛采用的集中化训练-分布式执行(Centralized Training with Decentralized Execution, CTDE)范式。该范式虽然可以有效解决环境的非平稳性问题,但由于其重通信和集中化处理的本质,使其在实际部...