自适应复合固定时间强化学习优化的非线性系统控制及其在智能船舶自动驾驶上的应用

智能船舶自动驾驶的非线性固定时间强化学习优化控制研究 近年来,智能自动驾驶技术逐渐成为自动化控制领域的研究热点之一。在复杂的非线性系统中,优化控制策略的设计,尤其是在固定时间内实现系统稳定性和性能优化方面,是控制工程师和研究人员面临的重要挑战之一。然而,现有的固定时间控制理论在实现系统状态收敛时,往往忽略了资源利用效率和平衡问题,这可能导致过度补偿或欠补偿的现象,从而使系统的稳态误差增加。此外,对于如何在时间限定内实现非线性不确定性估计误差的最小化,相关研究依然较少。因此,本研究旨在提出一种自适应复合固定时间强化学习优化控制解决方案,进一步解决这一关键问题。 研究背景及目的 固定时间控制理论自提出以来,由于收敛时间不依赖于初始状态的特点,其应用得到了广泛关注。相比有限时间控制方法,固定时间控...

基于策略共识的分布式确定性多智能体强化学习方法研究

基于策略共识的分布式确定性多智能体强化学习研究报告 强化学习(Reinforcement Learning, RL)近年来在诸多领域取得了显著突破,包括机器人学、智能电网和自动驾驶等。然而,在实际场景中,常常涉及到多智能体(Multi-Agent Reinforcement Learning, MARL)的协作学习问题。这类问题的核心挑战在于设计高效的多智能体协作强化学习算法,尤其是在受制于通信能力限制或隐私保护的情况下。目前,多数的MARL算法依赖一种被广泛采用的集中化训练-分布式执行(Centralized Training with Decentralized Execution, CTDE)范式。该范式虽然可以有效解决环境的非平稳性问题,但由于其重通信和集中化处理的本质,使其在实际部...

基于CORDIC的高效激活函数实现方法,用于FPGA上的RNN加速

RNN高效激活函数实现:CORDIC算法与FPGA硬件加速的突破 背景与研究意义 近年来,随着深度学习技术的迅猛发展,循环神经网络(Recurrent Neural Networks, RNNs)尤其是长短时记忆网络(Long Short-Term Memory, LSTM),在时间序列任务中展现出了强大的能力,例如在自然语言处理(Natural Language Processing, NLP)、语音识别和医学诊断等领域取得了广泛应用。然而,与卷积神经网络(Convolutional Neural Networks, CNNs)相比,RNN模型因其复杂性和大量非线性激活函数需求,导致计算代价显著增加。特别是在资源有限的边缘设备(Edge Devices)中部署RNN模型时,激活函数的实现成...

基于单片3D IGZO-RRAM-SRAM集成架构实现稳健且高效的计算存储

基于单片集成的三维IGZO-RRAM-SRAM计算存储新架构研究:提高神经网络计算效率的突破 背景与研究动机 随着神经网络(Neural Network, NN)在人工智能领域应用的不断深入,传统计算架构难以满足其在能耗、速度和密度方面的需求。这促使研究者将目光投向计算存储(Compute-In-Memory, CIM)芯片技术。CIM通过将计算单元与存储单元集成在一个架构中,避免大量数据在存储与计算单元间传递的“存储墙”效应,从而显著提高系统效率。已有CIM架构主要基于静态随机存取存储器(Static Random Access Memory, SRAM)、电阻随机存取存储器(Resistive Random Access Memory, RRAM)和氧化铟镓锌(Indium-Galliu...

硅橡胶在电痕化导致下的表面结构变化

研究揭示硅橡胶电气跟踪降解机制的前沿科学新闻 背景介绍:研究动机及问题 随着电力传输和配电系统的快速发展,高分子复合绝缘子已逐渐取代传统玻璃和陶瓷绝缘子,成为户外高压输电领域中的首选材料。这其中,基于硅橡胶的复合绝缘子因其重量轻、耐热性高、化学稳定性佳及疏水性能(hydrophobicity)的优秀表现,备受工程界的青睐。它们不仅在生产安装过程中具有较高的性价比,同时也能在长期运行中表现出优越的抗老化特性。然而,这些绝缘材料在实际的运行条件下会因受电气和环境应力(例如高电压、多变的天气因素、盐雾腐蚀等)的影响而逐渐退化,最终可能导致设备的失效甚至电网故障。因此,深入了解硅橡胶材料的退化机制,研究其材料结构随退化发生的重要变化,具有重要的科学意义和应用价值。 为了应对这一问题,本文研究基于实际...