分享自:

QuantAgents: 基于模拟交易的多智能体金融系统

期刊:findings of the association for computational linguistics: emnlp 2025

学术研究报告:QuantAgents——基于模拟交易的多智能体金融系统

一、研究团队与发表信息
本研究由华南理工大学(South China University of Technology)的Xiangyu Li、Yawen Zeng、Xiaofen Xing、Jin Xu(兼琶洲实验室Pazhou Lab成员)及佛山大学(Foshan University)的Xiangmin Xu(通讯作者)合作完成,发表于计算语言学领域顶会*Findings of the Association for Computational Linguistics: EMNLP 2025*(2025年11月4-9日),论文标题为《QuantAgents: Towards Multi-Agent Financial System via Simulated Trading》。

二、学术背景与研究目标
科学领域:本研究属于计算金融(Computational Finance)多智能体系统(Multi-Agent Systems, MAS)的交叉领域,结合大型语言模型(LLMs)与强化学习技术,旨在提升金融决策的自动化与智能化水平。
研究动机:现有基于LLM的金融智能体(如FinGPT、FinAgent)虽表现优异,但存在两大局限:
1. 依赖事后反思(Post-Reflection):仅在不利结果出现后调整策略,缺乏人类特有的长期趋势预测能力
2. 与真实基金公司流程脱节:未整合金融从业者广泛使用的模拟交易(Simulated Trading)工具。
研究目标:开发QuantAgents系统,通过多智能体协作与模拟交易环境,实现长期市场预测与风险控制,弥合AI智能体与人类专家的差距。

三、研究流程与方法
1. 系统框架设计
QuantAgents包含四个分工明确的智能体:
- 模拟交易分析师(Bob):测试策略在历史数据中的表现;
- 风险控制分析师(Dave):评估策略风险;
- 市场新闻分析师(Emily):生成市场报告;
- 经理(Otto):综合信息执行决策。
智能体通过三类会议协作:
- 市场分析会议(每周):整合新闻、行业与个股分析;
- 策略开发会议(每周):通过模拟交易优化策略;
- 风险警报会议(触发式):当风险评分(RScore)>0.75时启动。

2. 核心技术模块
- 工具集(26种):涵盖技术指标分析(T1)、压力测试(T17)、情感分析(T2)等;
- 记忆系统:分为市场信息记忆(M_I)、策略记忆(M_S)、报告记忆(M_R);
- 双奖励机制:同时优化真实市场收益(R_real)与模拟交易预测准确率(R_sim),权重动态调整。

3. 实验设置
- 数据集:纳斯达克100指数成分股(2010-2023年),包含股价、新闻、财报等;
- 基准模型:对比经典量化策略(如ZMR)、RL方法(如DeepTrader)及LLM基线(如FinAgent);
- 评估指标:9项金融指标,包括年化收益率(ARR)、夏普比率(SR)、最大回撤(MDD)等。

四、主要研究结果
1. 整体性能
QuantAgents在测试期(2021-2023年)实现累计收益299.55%(ARR 58.68%),显著优于最佳基线HedgeAgents(230.39%)。其核心优势体现在:
- 风险控制:MDD(16.86%)低于所有基线,波动率(Vol 1.43%)接近市场指数(NDX 1.52%);
- 策略多样性:熵值(Ent 2.97)与有效下注数(ENB 1.49)最高,表明投资组合分散性更优。

  1. 模块贡献分析
  • 模拟交易的预测价值:策略开发会议中,模拟交易筛选的策略(μ’)使最终策略(μ*)收益提升40.45%;
  • 多会议协同效应:同时启用三类会议时,ARR较单一会议组合提升19.15%(见表3)。
  1. 实时交易验证
    在A股与港股市场(2024Q3-2025Q1)的实盘测试中,QuantAgents分别实现111.87%97.69%的收益,Sharpe比率均超1.7,验证其泛化能力。

五、研究结论与价值
科学价值
1. 首创性:首个将模拟交易整合至多智能体金融系统的研究,模拟人类量化交易员工作流;
2. 方法论创新:双奖励机制推动智能体做出前瞻性决策,解决LLM依赖事后反思的局限。
应用价值
- 风险可控的策略测试:通过模拟交易验证策略,避免真实资金损失;
- 行业工具开源:发布全部代码与数据集(https://quantagents.github.io/),推动领域发展。

六、研究亮点
1. 性能突破:在PrudEx基准(Sun et al., 2023a)上全面领先,收益较基线提升30.02%;
2. 架构创新:智能体分工与会议机制模拟真实基金公司流程,工具集(如RiskAnalyzer)覆盖金融分析全流程;
3. 低成本部署:基于GPT-4o的日均成本仅0.17美元,具备商业化潜力。

七、局限与展望
1. 泛化性:当前仅验证于纳斯达克100成分股,未来需扩展至其他市场;
2. 信息泄露风险:需进一步研究LLM在历史数据中的过拟合问题。
伦理声明:研究仅使用公开数据,未涉及敏感信息,纯属学术用途。

(注:专业术语如“Sharpe Ratio”首次出现时标注英文原词,后续使用中文“夏普比率”)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com