分享自:

FinCon:一种基于LLM的多智能体系统,用于增强金融决策

期刊:38th conference on neural information processing systems (NeurIPS 2024)

FinCon:基于大语言模型的多智能体金融决策系统——学术研究报告

一、作者与机构
本研究由Yangyang Yu、Zhiyuan Yao、Haohang Li等来自Stevens Institute of Technology、Harvard University及The Fin AI的研究团队共同完成,通讯作者为Qianqian Xie(邮箱:qianqian.xie@yale.edu)。论文发表于第38届NeurIPS(Conference on Neural Information Processing Systems)2024会议。

二、学术背景
科学领域:本研究属于金融科技与人工智能交叉领域,聚焦于大语言模型(LLM)在复杂金融决策任务中的应用。
研究动机:传统金融决策面临市场波动性高、风险管理需求复杂等挑战,而现有LLM智能体系统在信息整合与经验优化方面存在不足。FinCon的提出旨在通过多智能体协同架构与双重风险控制机制,提升金融决策的鲁棒性和适应性。
核心目标:开发一个支持单股交易与投资组合管理的通用框架,通过自然语言交互实现智能体协作,并优化风险调整后的收益。

三、研究流程与方法
1. 系统架构设计
- 分层结构:仿照现实投资公司,设计“经理-分析师”层级结构。7类分析师智能体(如新闻分析、财报解析、音频处理等)分别处理不同模态的市场数据(文本、表格、音频),经理智能体整合信息并生成交易决策。
- 风险控制模块
- 日内风险控制(Within-episode):采用条件风险价值(CVaR, Conditional Value at Risk)监控每日市场风险,触发实时交易调整。
- 跨周期风险控制(Over-episode):通过概念化语言强化(CVRF, Conceptual Verbal Reinforcement)更新投资信念,优化长期策略。

  1. 算法实现

    • 投资组合优化:基于马科维茨均值-方差模型(Markowitz Mean-Variance),通过外部求解器计算权重(公式1),支持多空双向操作。
    • POMDP建模:将金融决策建模为部分可观测马尔可夫决策过程(POMDP),定义状态空间、动作空间(如“买入/卖出/持有”)及奖励函数(以每日盈亏PnL为输出)。
  2. 实验验证

    • 数据集:整合2022年1月至2023年6月的多模态数据(股价、新闻、财报、电话会议音频)。
    • 对比基线
      • 单股交易:对比DRL(A2C、PPO、DQN)、LLM智能体(FinGPT、FinMem等)及买入持有策略。
      • 投资组合管理:对比马科维茨模型、FinRL-A2C及等权ETF策略。
    • 评估指标:累计收益率(CR%)、夏普比率(SR)、最大回撤(MDD%)。

四、主要结果
1. 单股交易性能
- FinCon在8只股票测试中均显著优于基线。例如:
- 特斯拉(TSLA):CR达82.871%(市场基准6.425%),夏普比率1.972。
- Coinbase(COIN):CR为57.045%(基准-21.756%),克服DRL对IPO数据不足的局限。
- 关键优势:通过多智能体分工降低信息过载,避免FinAgent等单智能体的认知瓶颈。

  1. 投资组合管理

    • 组合1(TSLA+MSFT+PFE):CR达113.836%,夏普比率3.269,显著优于马科维茨模型(CR 12.636%)。
    • 挑战:多资产决策易受幻觉干扰,但FinCon通过任务分解控制误差。
  2. 消融实验

    • 风险控制机制:移除CVaR监控后,GOOG交易CR从25.077%降至-1.461%;移除CVRF信念更新后,组合管理CR从113.836%降至28.432%。
    • 训练效率:仅需4个训练周期即可收敛,远少于传统DRL算法。

五、结论与价值
1. 科学价值
- 提出首个支持多模态数据整合与投资组合管理的LLM多智能体框架。
- 验证语言强化在金融决策中的有效性,为LLM在动态环境中的应用提供新范式。

  1. 应用价值
    • 为量化投资机构提供低通信成本、高适应性的自动化工具。
    • 开源代码(GitHub: the-finai/fincon)推动金融AI社区发展。

六、研究亮点
1. 创新架构:经理-分析师分层设计减少冗余通信,较StockAgent等讨论式系统降低30%通信开销。
2. 双重风险控制:CVaR与CVRF结合,首次实现金融决策的实时与长期风险协同管理。
3. 泛化能力:统一框架支持单股与组合任务,填补FinGPT等系统仅限单资产的空白。

七、其他发现
- 音频数据作用:分析师智能体通过Whisper API解析电话会议音频,提升对短期市场波动的敏感性(如财报发布日波动率预测误差降低15%)。
- 记忆模块优化:基于时效性的记忆衰减机制(附录A.13)显著改善信息检索相关性。

(注:专业术语如CVaR、PnL等首次出现时标注英文,后续直接使用中文译名。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com