使用神经符号回归发现网络动力学

分享自：

使用神经符号回归发现网络动力学

生物物理及生物化学

公共卫生

期刊:nature computational scienceDOI:10.1038/s43588-025-00893-8

【点击此处】阅读全文、收藏及针对性提问

神经网络符号回归揭示复杂网络动态规律——ND²方法在多领域系统建模中的突破性应用
一、研究团队与发表信息
 本研究成果由清华大学电子工程系、北京信息科学与技术国家研究中心的Zihan Yu、Jingtao Ding和Yong Li团队完成，发表于Nature Computational Science期刊（2025年9月在线发表，DOI: 10.1038/s43588-025-00893-8）。
二、学术背景与研究目标
 复杂网络动态（network dynamics）是分析高维系统（如基因调控网络、流行病传播网络）的核心理论工具，但传统模型依赖专家经验，仅适用于少数已知原理的领域。随着观测数据积累，亟需一种自动从数据推导数学模型的通用方法。针对此问题，研究团队提出ND²（Neural Discovery of Network Dynamics）方法，结合符号回归（symbolic regression）与深度学习，实现网络动态公式的自动发现。其核心目标包括：
 1. 降维搜索：通过设计网络动态算子（network dynamical operators），将高维网络搜索问题转化为等效一维问题；
 2. 高效发现：利用预训练神经网络（NDformer）引导符号搜索，提升公式发现效率；
 3. 多领域验证：在合成系统、生物系统和社交网络中验证方法的普适性与准确性。
三、研究方法与流程
 1. 网络动态算子设计
 - 提出三类算子：源算子（ϕₛ）、目标算子（ϕₜ）和聚合算子（ρ），将节点级变量与边级变量相互映射（如公式5-7）。例如，ϕₛ提取边的源节点状态，ρ聚合邻居边信息至目标节点。
 - 算子作用：将传统公式长度从O((nd)^nl)降至O(dl)，独立于网络规模n（图1c）。
NDformer引导的符号搜索
架构：融合图神经网络（GNN）与Transformer（图1e），编码网络结构与节点活动数据，预测公式符号概率分布。
 
训练：在100万随机生成的动态系统数据集上预训练（包含ER、WS、BA等多种网络拓扑），学习低维流形上的状态分布（高斯混合模型），加速搜索58倍（补充图10）。
 
蒙特卡洛树搜索（MCTS）：结合NDformer的符号概率与奖励函数（公式8），平衡公式精度与简洁性。
 
实验验证
合成系统：在10类经典模型（如Kuramoto、FitzHugh-Nagumo）中，ND²准确恢复全部真实公式（R²=1.0），搜索速度比无NDformer快3个数量级（图2f-g）。
 
生物系统：
 基因调控网络：修正Hill方程模型，发现高阶相互作用（公式2），预测误差降低59.98%（图3e-f）；
 
微生物群落：改进Lotka-Volterra模型，揭示种群敏感性反比于规模的规律（公式3），误差降低55.94%（图4f-g）。
 
流行病传播：在跨尺度人类移动网络中，发现节点相关性遵循幂律分布（p(g)∝g⁻⁰·⁸⁰），并揭示中美干预策略差异（图5h）。
 
四、主要结果与逻辑链条
 1. 算子有效性：通过Kuramoto模型示例（图1d），展示算子如何将∑aᵢⱼsin(xᵢ−xⱼ)转化为ρ(sin(ϕₛ(x)−ϕₜ(x)))，验证降维能力。
 2. NDformer加速效果：在FitzHugh-Nagumo系统中，预训练使搜索时间从53,240秒缩短至6.57秒（图2h）。
 3. 模型修正：在基因调控中，新公式通过逻辑函数σ(∑aᵢⱼxⱼ)替代传统分项作用，反映环境介导的高阶交互（图3d）。
 4. 跨尺度规律：COVID-19传播动力学在不同区域均呈现相同幂律响应，表明系统普适性（图5e）。
五、结论与价值
 1. 科学价值：首次实现高维网络动态的符号回归，突破传统方法对预定义函数库的依赖，推动复杂性科学理论发展。
 2. 应用价值：
 - 为生态学（微生物互作）、分子生物学（基因调控）、公共卫生（流行病预测）提供自动建模工具；
 - 发现中美防疫策略差异（中国存在临界流量阈值β_c，美国为线性响应），支持精准干预设计。
六、研究亮点
 1. 方法创新：网络动态算子+NDformer架构，解决高维搜索难题；
 2. 跨领域验证：从合成系统到真实生物、社会网络，证明普适性；
 3. 科学发现：揭示高阶基因互动、种群敏感性与规模的反比关系等新机制。
七、其他贡献
 - 开源数据与代码：提供完整实验数据集与ND²实现（GitHub/Zenodo）；
 - 扩展性：方法可推广至超图（hypergraph）动态与非加性聚合系统（补充章节1.3）。
（注：术语翻译示例：符号回归-symbolic regression；蒙特卡洛树搜索-Monte Carlo tree search, MCTS；幂律分布-power-law distribution）

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问