学术研究报告:基于大语言模型(LLM)的量化投资策略自动化发现框架
第一作者及机构
本研究由香港科技大学(The Hong Kong University of Science and Technology)的Zhizhuo Kou、Sirui Han、Yike Guo等团队主导,合作机构包括香港科技大学(广州校区)和北京大学。研究成果发表于2025年11月的*Findings of the Association for Computational Linguistics: EMNLP 2025*(页码18517–18533)。
学术背景
研究领域与动机
本研究属于计算金融(Computational Finance)与自然语言处理(NLP)的交叉领域,旨在解决传统量化投资策略的局限性:
1. 传统模型的脆弱性:基于深度学习的量化模型在动态市场环境中表现不稳定,难以适应市场状态变化。
2. 数据多样性挑战:尽管机器学习技术进步,但多源金融数据(如文本、数值、图表)的整合仍存在困难。
3. 市场适应性不足:现有策略缺乏对市场状态(如牛市、熊市)的动态响应能力。
研究目标
提出一种三阶段框架,结合大语言模型(LLM)和多智能体系统(Multi-Agent System),实现以下目标:
- 自动生成可执行的阿尔法因子(Alpha Factor)候选集;
- 通过多模态智能体评估筛选因子,平衡预测质量与风险;
- 动态优化因子权重,构建适应市场状态的量化策略。
研究流程与方法
1. 基于LLM的种子阿尔法生成(Seed Alpha Factory, SAF)
- 输入数据:11份金融研究文档(涵盖动量、均值回归、波动率等理论)。
- LLM处理:使用GPT-4o模型对文档进行过滤、分类,生成100个种子阿尔法因子,分为9类(如动量、基本面、流动性)。
- 创新点:通过提示工程(Prompt Engineering)将文本解析为可执行的数学表达式(如动量因子公式:
close - delay(close, 14))。
2. 多模态智能体评估
- 数据模态:文本(财报、新闻)、数值(OHLCV价格数据)、图表(K线图)、音频(财经广播)、视频(财经频道)。
- 智能体分工:
- 置信度评分智能体(Confidence Score Agent, CSA):计算因子的信息系数(Information Coefficient, IC),评估预测能力。
- 风险偏好智能体(Risk Preference Agent, RPA):分析因子在不同市场状态下的风险收益特性。
- 算法:基于类别平衡的阿尔法选择算法(见附录A.5),确保因子多样性与独立性。
3. 动态权重优化
- 模型架构:3层MLP(多层感知机),输入为历史阿尔法值,输出为未来收益率预测。
- 训练方法:反向传播(Backpropagation)与梯度下降(Gradient Descent),损失函数为预测与实际收益的差异。
- 动态调整:根据市场状态(如波动率、趋势强度)实时更新因子权重。
主要实验结果
1. 阿尔法因子有效性验证
- IC对比:LLM生成的因子在波动率(Volatility)和基本面(Fundamental)类别中表现最优(IC均值0.0258 vs. 传统方法0.0177)。
- 组合效果:12个因子的加权组合在SSE50指数(2023年)测试中累计收益达53.17%,显著跑赢基准(-11.73%)。
2. 跨市场与跨周期鲁棒性
- 中国市场(CSI300):在2023年H1实现192.27%年化收益,同期基准仅9.13%。
- 美国市场(SP500):在2021年H1收益93.61%,远超基准29.67%。
- 抗跌性:2022年熊市中策略仍保持正收益(中国市场12.78%,美国市场2.77%)。
3. 消融实验(Ablation Study)
- 智能体贡献:移除CSA导致熊市IC下降50%(0.042→0.021),移除RPA导致夏普比率(Sharpe Ratio)下降30%(1.94→1.34)。
- 权重敏感性:CSA与RPA权重比为0.6:0.4时,夏普比率最高(11.39)。
结论与价值
科学价值
1. 方法论创新:首次将LLM与多智能体系统结合,实现端到端的量化策略生成。
2. 跨学科融合:推动了计算语言学(Computational Linguistics)与量化金融的交叉研究。
应用价值
- 自动化投资:框架无需人工干预,可扩展至股票、期货等多资产类别。
- 开源贡献:代码公开于GitHub(https://github.com/kouzhizhuo/automate-strategy-finding-with-llm-in-quant-investment)。
研究亮点
- 多模态数据处理:整合文本、图表、音频等非结构化数据,增强市场状态感知能力。
- 动态适应性:通过权重门控层(Weight Gating Layer)实时调整策略,优于静态模型。
- 实证优势:在中美市场均实现超额收益,验证了框架的普适性。
局限性
- 依赖输入数据质量,可能引入文献偏差;
- 部分LLM生成的因子缺乏金融直觉,需进一步优化。
附录
- 种子阿尔表示例:见图4(DPO因子公式与计算步骤)。
- 多模态数据类型:见表11(涵盖文本、数值、视觉等5类数据)。
- 策略构建细节:每日持仓Top-13股票,最大换仓5只,控制交易成本。