分享自:

R&D-Agent-Quant:面向数据因素与模型联合优化的多智能体框架

期刊:39th conference on neural information processing systems (NeurIPS 2025)

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


R&D-Agent-Quant:数据驱动因子与模型联合优化的多智能体框架学术报告

一、作者与发表信息

本研究由来自Carnegie Mellon University的Yuante Li、Microsoft Research Asia的Xu Yang、Xiao Yang、Weiqing Liu(通讯作者)和Jiang Bian、Hong Kong University of Science and Technology的Minrui Xu,以及University of Oxford的Xisen Wang合作完成。论文发表于NeurIPS 2025(第39届神经信息处理系统会议)。

二、学术背景

研究领域
本研究属于量化金融(quantitative finance)人工智能(AI)的交叉领域,聚焦于通过多智能体系统(multi-agent systems)自动化量化投资策略的开发流程。

研究动机
传统量化研究面临三大挑战:
1. 自动化程度低:因子挖掘(factor mining)和模型创新(model innovation)依赖人工干预,迭代效率低;
2. 可解释性差:现有基于大语言模型(LLM)的智能体直接生成交易信号,缺乏可验证的因子构建逻辑;
3. 优化碎片化:因子与模型的优化过程割裂,缺乏协同反馈机制。

研究目标
提出R&D-Agent(Q)框架,首次实现量化策略研发全流程自动化,通过因子-模型联合优化(factor-model co-optimization)提升预测精度与策略鲁棒性。

三、研究流程与方法

研究分为五个核心模块,形成闭环迭代系统:

  1. Specification Unit(规范单元)

    • 功能:定义任务背景与约束条件,确保下游模块一致性。
    • 关键设计:将任务编码为四元组$S=(B,D,F,M)$,分别表示先验假设、数据接口、输出格式和执行环境(如QLib回测平台)。
  2. Synthesis Unit(合成单元)

    • 功能:基于历史实验生成新假设。
    • 流程
      • 维护当前最优解集合(SOTA);
      • 通过生成式映射$g$结合历史假设$h_t$和反馈$ft$生成新假设$h{t+1}$;
      • 将假设分解为可执行任务(如因子任务可拆分为子任务)。
  3. Implementation Unit(实现单元)

    • 核心智能体Co-Steer,专为量化任务设计的代码生成智能体。
      • 创新方法
      • 基于任务依赖关系构建有向无环图(DAG),动态调度任务顺序;
      • 通过知识库(knowledge base)存储任务-代码-反馈三元组,支持相似任务迁移学习。
  4. Validation Unit(验证单元)

    • 因子去重:计算新因子与SOTA因子的信息系数(IC),剔除冗余因子(IC≥0.99);
    • 回测评估:将因子或模型与SOTA组件配对,通过QLib平台进行市场模拟测试。
  5. Analysis Unit(分析单元)

    • 功能:多维度评估实验结果,指导下一轮优化方向。
    • 创新算法:基于上下文汤普森采样(contextual Thompson sampling)的bandit调度器,动态选择因子优化或模型优化路径。

四、主要结果

  1. 因子优化(R&D-Factor)

    • 使用70% fewer factors的情况下,年化收益率(ARR)达14.61%,较传统因子库(如Alpha 158)提升2倍;
    • 信息系数(IC)最高达0.0497,显著优于Alpha 360(IC=0.0420)。
  2. 模型优化(R&D-Model)

    • 在固定因子集下,R&D-Model的Rank IC达0.0546,最大回撤(MDD)仅-6.94%,优于所有基线模型(如Transformer、LSTM)。
  3. 联合优化(R&D-Agent(Q))

    • 协同优化使IC提升至0.0532,ARR达14.21%,信息比率(IR)为1.74,均显著超过单独优化结果。

结果逻辑链
因子优化通过动态假设生成筛选出高信息量信号 → 模型优化利用这些信号构建鲁棒预测结构 → 联合优化通过反馈闭环实现性能叠加。

五、结论与价值

科学价值
- 首次提出数据为中心(data-centric)的多智能体量化框架,解决了自动化与可解释性矛盾;
- 通过Co-Steer智能体bandit调度器,实现了因子-模型协同进化的方法论突破。

应用价值
- 成本低于10美元即可部署,适用于中小型投资机构;
- 在CSI 300、NASDAQ 100等市场均验证了泛化性。

六、研究亮点

  1. 端到端自动化:覆盖从因子生成到策略回测的全流程,减少人工干预;
  2. 高性能工具:Co-Steer智能体的代码生成准确率在5次尝试内(Pass@5)达90%;
  3. 资源效率:联合优化在减少70%因子的同时实现2倍收益提升。

七、其他价值


(报告字数:约2000字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com