强化学习-术语-FmRead学术前沿

学术背景趋化性（chemotaxis）是细胞或微生物沿化学梯度定向运动的关键行为，在免疫反应、伤口愈合和病原体感染等生理过程中发挥重要作用。然而，细胞如何在复杂梯度环境中选择最优运动模式（如伪足分裂或从头形成）仍不清楚。传统模型假设细胞通过全局梯度感知（global gradient sensing）实现导航，但这一机制在浅梯度（shallow gradients）或动态环境中可能效率不足。本研究聚焦于变形虫样细胞（如*Dictyostelium discoideum*）的伪足（pseudopod）动态，提出了一种基于机械智能（mechanical intelligence）的简化模型：伪足通过竞争有限的肌动蛋白（actin）资源实现方向决策，无需依赖复杂的信号通路或记忆机制。论文来源...

人工智能对话系统中的共情反应生成研究学术背景随着人工智能技术的快速发展，开放域对话系统（open-domain dialogue systems）逐渐成为研究热点。这类系统旨在与用户进行自然、流畅的对话，提供合理的回应。然而，尽管现有的对话系统在语言流畅性和连贯性方面取得了显著进展，但其在共情（empathy）能力上的不足仍然显著。共情是指理解他人经历和情感的能力，包括情感共情（affective empathy）和认知共情（cognitive empathy）。情感共情涉及对用户情感的反应，而认知共情则侧重于理解用户的情境。共情是人类交流的基本特征，对于构建拟人化的对话系统至关重要。然而，现有的共情反应生成（empathetic response generation）方法主要依赖于...

无人水面车辆（USV）的模型预测控制新方法：基于概率神经网络的MBRL框架学术背景无人水面车辆（Unmanned Surface Vehicles, USV）近年来在海洋科学领域迅速发展，广泛应用于海洋运输、环境监测、灾害救援等场景。然而，USV的控制系统仍然面临诸多挑战，尤其是在复杂海洋环境中应对外部干扰的能力。传统的模型自由强化学习（Model-Free Reinforcement Learning, MFRL）方法虽然在某些任务中表现良好，但其依赖大量数据和模拟训练，且缺乏对不确定环境的鲁棒性。为了解决这些问题，模型基础强化学习（Model-Based Reinforcement Learning, MBRL）方法应运而生。MBRL通过同时学习环境模型和优化控制策略，能够更高效地应...

多智能体混合环境协作导航研究：基于关系图学习的强化学习新方法移动机器人技术正随着人工智能领域的发展迎来应用热潮，其中导航能力是移动机器人研究的核心热点之一。传统导航方法在面对动态环境、障碍物规避以及多机器人协作任务时，往往面临算法复杂度、计算资源消耗以及模型普适性的问题。针对这些问题，来自Central South University与Zhejiang University of Technology的研究团队提出了一种基于关系图注意力网络（Graph Attention Network, GAT）的新方法，称为GAR-CoNav，为混合环境中的多目标协作导航问题（Multi-Robot Cooperative Navigation Problem, MCNP）提供了新的解决方案。这篇发...

智能船舶自动驾驶的非线性固定时间强化学习优化控制研究近年来，智能自动驾驶技术逐渐成为自动化控制领域的研究热点之一。在复杂的非线性系统中，优化控制策略的设计，尤其是在固定时间内实现系统稳定性和性能优化方面，是控制工程师和研究人员面临的重要挑战之一。然而，现有的固定时间控制理论在实现系统状态收敛时，往往忽略了资源利用效率和平衡问题，这可能导致过度补偿或欠补偿的现象，从而使系统的稳态误差增加。此外，对于如何在时间限定内实现非线性不确定性估计误差的最小化，相关研究依然较少。因此，本研究旨在提出一种自适应复合固定时间强化学习优化控制解决方案，进一步解决这一关键问题。研究背景及目的固定时间控制理论自提出以来，由于收敛时间不依赖于初始状态的特点，其应用得到了广泛关注。相比有限时间控制方法，固定时间控...

浅梯度中持续伪足分裂是一种有效的趋化策略

基于强化学习的共情反应生成框架

基于概率神经网络的强化学习模型在预测控制无人水面艇中的高效应用

混合环境中基于关系图学习的强化学习多智能体协作导航

自适应复合固定时间强化学习优化的非线性系统控制及其在智能船舶自动驾驶上的应用