这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由Yangyang Yu、Zhiyuan Yao、Haohang Li等来自Stevens Institute of Technology、Harvard University和The Fin AI的研究团队共同完成,通讯作者为Qianqian Xie(邮箱:qianqian.xie@yale.edu)。论文发表于NeurIPS 2024(第38届神经信息处理系统会议),标题为《FinCon: A Synthesized LLM Multi-Agent System with Conceptual Verbal Reinforcement for Enhanced Financial Decision Making》。
研究聚焦于金融决策支持系统,结合大语言模型(LLM, Large Language Model)与多智能体协作技术,解决金融市场中因环境波动性和风险管理复杂性导致的序列决策难题。现有LLM智能体在金融任务(如股票交易、投资组合管理)中面临三大局限:
1. 长期风险暴露控制不足:依赖短期市场波动的风险偏好,忽视基本面因素;
2. 多资产适应性差:现有系统多限于单一资产交易,难以扩展至投资组合管理;
3. 通信成本高:多智能体间冗余讨论导致决策延迟。
提出FinCon框架,通过以下创新解决上述问题:
- 设计分层管理的多智能体协作结构(Manager-Analyst Hierarchy),模拟现实投资公司分工;
- 引入双重风险控制机制(Dual-Level Risk Control),结合短期市场风险监控(CVaR)与长期投资信念更新(CVRF);
- 实现跨任务泛化能力,支持单一股票交易与多资产组合管理。
FinCon包含两大核心组件:
- Manager-Analyst智能体群:
- 分析师智能体(Analyst Agents):7类专一化智能体,分别处理文本新闻、财报(10-Q/10-K)、音频(ECC)、时序数据等,提取特定模态的投资信号。
- 经理智能体(Manager Agent):整合分析师输入,生成交易决策(买/卖/持有),并通过优化器计算组合权重(Mean-Variance Optimization)。
- 风险控制组件(Risk-Control Component):
- Episode内风险控制:基于条件风险价值(CVaR, Conditional Value at Risk)实时监控日级风险,触发经理智能体的自我反思(Self-Reflection);
- Episode间信念更新:通过概念化语言强化(CVRF, Conceptual Verbal Reinforcement)提炼盈利与亏损轨迹中的经验,生成可传播的投资信念。
FinCon在8只股票上均显著优于基线:
- 特斯拉(TSLA):CR达82.87%(对比B&H的6.43%),夏普比率1.972;
- Coinbase(COIN):CR为57.05%(B&H为-21.76%),克服DRL因IPO数据不足导致的收敛问题;
- 风险控制有效性:在熊市股(如NIO)中,CVaR机制将CR从-52.89%提升至17.46%。
(报告字数:约2000字)