神经网络符号回归揭示复杂网络动态规律——ND²方法在多领域系统建模中的突破性应用
一、研究团队与发表信息
本研究成果由清华大学电子工程系、北京信息科学与技术国家研究中心的Zihan Yu、Jingtao Ding和Yong Li团队完成,发表于Nature Computational Science期刊(2025年9月在线发表,DOI: 10.1038/s43588-025-00893-8)。
二、学术背景与研究目标
复杂网络动态(network dynamics)是分析高维系统(如基因调控网络、流行病传播网络)的核心理论工具,但传统模型依赖专家经验,仅适用于少数已知原理的领域。随着观测数据积累,亟需一种自动从数据推导数学模型的通用方法。针对此问题,研究团队提出ND²(Neural Discovery of Network Dynamics)方法,结合符号回归(symbolic regression)与深度学习,实现网络动态公式的自动发现。其核心目标包括:
1. 降维搜索:通过设计网络动态算子(network dynamical operators),将高维网络搜索问题转化为等效一维问题;
2. 高效发现:利用预训练神经网络(NDformer)引导符号搜索,提升公式发现效率;
3. 多领域验证:在合成系统、生物系统和社交网络中验证方法的普适性与准确性。
三、研究方法与流程
1. 网络动态算子设计
- 提出三类算子:源算子(ϕₛ)、目标算子(ϕₜ)和聚合算子(ρ),将节点级变量与边级变量相互映射(如公式5-7)。例如,ϕₛ提取边的源节点状态,ρ聚合邻居边信息至目标节点。
- 算子作用:将传统公式长度从O((nd)^nl)降至O(dl),独立于网络规模n(图1c)。
NDformer引导的符号搜索
实验验证
四、主要结果与逻辑链条
1. 算子有效性:通过Kuramoto模型示例(图1d),展示算子如何将∑aᵢⱼsin(xᵢ−xⱼ)转化为ρ(sin(ϕₛ(x)−ϕₜ(x))),验证降维能力。
2. NDformer加速效果:在FitzHugh-Nagumo系统中,预训练使搜索时间从53,240秒缩短至6.57秒(图2h)。
3. 模型修正:在基因调控中,新公式通过逻辑函数σ(∑aᵢⱼxⱼ)替代传统分项作用,反映环境介导的高阶交互(图3d)。
4. 跨尺度规律:COVID-19传播动力学在不同区域均呈现相同幂律响应,表明系统普适性(图5e)。
五、结论与价值
1. 科学价值:首次实现高维网络动态的符号回归,突破传统方法对预定义函数库的依赖,推动复杂性科学理论发展。
2. 应用价值:
- 为生态学(微生物互作)、分子生物学(基因调控)、公共卫生(流行病预测)提供自动建模工具;
- 发现中美防疫策略差异(中国存在临界流量阈值β_c,美国为线性响应),支持精准干预设计。
六、研究亮点
1. 方法创新:网络动态算子+NDformer架构,解决高维搜索难题;
2. 跨领域验证:从合成系统到真实生物、社会网络,证明普适性;
3. 科学发现:揭示高阶基因互动、种群敏感性与规模的反比关系等新机制。
七、其他贡献
- 开源数据与代码:提供完整实验数据集与ND²实现(GitHub/Zenodo);
- 扩展性:方法可推广至超图(hypergraph)动态与非加性聚合系统(补充章节1.3)。
(注:术语翻译示例:符号回归-symbolic regression;蒙特卡洛树搜索-Monte Carlo tree search, MCTS;幂律分布-power-law distribution)