分享自:

使用神经符号回归发现网络动力学

期刊:nature computational scienceDOI:10.1038/s43588-025-00893-8

神经网络符号回归揭示复杂网络动态规律——ND²方法在多领域系统建模中的突破性应用

一、研究团队与发表信息
本研究成果由清华大学电子工程系、北京信息科学与技术国家研究中心的Zihan YuJingtao DingYong Li团队完成,发表于Nature Computational Science期刊(2025年9月在线发表,DOI: 10.1038/s43588-025-00893-8)。

二、学术背景与研究目标
复杂网络动态(network dynamics)是分析高维系统(如基因调控网络、流行病传播网络)的核心理论工具,但传统模型依赖专家经验,仅适用于少数已知原理的领域。随着观测数据积累,亟需一种自动从数据推导数学模型的通用方法。针对此问题,研究团队提出ND²(Neural Discovery of Network Dynamics)方法,结合符号回归(symbolic regression)与深度学习,实现网络动态公式的自动发现。其核心目标包括:
1. 降维搜索:通过设计网络动态算子(network dynamical operators),将高维网络搜索问题转化为等效一维问题;
2. 高效发现:利用预训练神经网络(NDformer)引导符号搜索,提升公式发现效率;
3. 多领域验证:在合成系统、生物系统和社交网络中验证方法的普适性与准确性。

三、研究方法与流程
1. 网络动态算子设计
- 提出三类算子:源算子(ϕₛ)目标算子(ϕₜ)聚合算子(ρ),将节点级变量与边级变量相互映射(如公式5-7)。例如,ϕₛ提取边的源节点状态,ρ聚合邻居边信息至目标节点。
- 算子作用:将传统公式长度从O((nd)^nl)降至O(dl),独立于网络规模n(图1c)。

  1. NDformer引导的符号搜索

    • 架构:融合图神经网络(GNN)与Transformer(图1e),编码网络结构与节点活动数据,预测公式符号概率分布。
    • 训练:在100万随机生成的动态系统数据集上预训练(包含ER、WS、BA等多种网络拓扑),学习低维流形上的状态分布(高斯混合模型),加速搜索58倍(补充图10)。
    • 蒙特卡洛树搜索(MCTS):结合NDformer的符号概率与奖励函数(公式8),平衡公式精度与简洁性。
  2. 实验验证

    • 合成系统:在10类经典模型(如Kuramoto、FitzHugh-Nagumo)中,ND²准确恢复全部真实公式(R²=1.0),搜索速度比无NDformer快3个数量级(图2f-g)。
    • 生物系统
      • 基因调控网络:修正Hill方程模型,发现高阶相互作用(公式2),预测误差降低59.98%(图3e-f);
      • 微生物群落:改进Lotka-Volterra模型,揭示种群敏感性反比于规模的规律(公式3),误差降低55.94%(图4f-g)。
    • 流行病传播:在跨尺度人类移动网络中,发现节点相关性遵循幂律分布(p(g)∝g⁻⁰·⁸⁰),并揭示中美干预策略差异(图5h)。

四、主要结果与逻辑链条
1. 算子有效性:通过Kuramoto模型示例(图1d),展示算子如何将∑aᵢⱼsin(xᵢ−xⱼ)转化为ρ(sin(ϕₛ(x)−ϕₜ(x))),验证降维能力。
2. NDformer加速效果:在FitzHugh-Nagumo系统中,预训练使搜索时间从53,240秒缩短至6.57秒(图2h)。
3. 模型修正:在基因调控中,新公式通过逻辑函数σ(∑aᵢⱼxⱼ)替代传统分项作用,反映环境介导的高阶交互(图3d)。
4. 跨尺度规律:COVID-19传播动力学在不同区域均呈现相同幂律响应,表明系统普适性(图5e)。

五、结论与价值
1. 科学价值:首次实现高维网络动态的符号回归,突破传统方法对预定义函数库的依赖,推动复杂性科学理论发展。
2. 应用价值
- 为生态学(微生物互作)、分子生物学(基因调控)、公共卫生(流行病预测)提供自动建模工具;
- 发现中美防疫策略差异(中国存在临界流量阈值β_c,美国为线性响应),支持精准干预设计。

六、研究亮点
1. 方法创新:网络动态算子+NDformer架构,解决高维搜索难题;
2. 跨领域验证:从合成系统到真实生物、社会网络,证明普适性;
3. 科学发现:揭示高阶基因互动、种群敏感性与规模的反比关系等新机制。

七、其他贡献
- 开源数据与代码:提供完整实验数据集与ND²实现(GitHub/Zenodo);
- 扩展性:方法可推广至超图(hypergraph)动态与非加性聚合系统(补充章节1.3)。

(注:术语翻译示例:符号回归-symbolic regression;蒙特卡洛树搜索-Monte Carlo tree search, MCTS;幂律分布-power-law distribution)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com