分享自:

LLM增强的Black-Litterman投资组合优化

期刊:Proceedings of the 34th ACM International Conference on Information and Knowledge Management (CIKM '25)DOI:10.48550/arxiv.2504.14345

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


LLM-Enhanced Black-Litterman 投资组合优化研究:基于大语言模型的系统性投资视图生成框架

作者与机构
本研究由来自韩国多个机构的团队合作完成,包括:
- Youngbin Lee(Elice AI Quant Lab, ModuLabs)
- Yejin Kim(Meritz Fire & Marine Insurance AI Quant Lab, ModuLabs)
- Juhyeong Kim(Mirae Asset Global Investments AI Quant Lab, ModuLabs)
- Suin Kim(Elice)
- Yongjae Lee†(UNIST,通讯作者)

论文发表于2025年11月的ACM CIKM’25 Workshop on FinAI,并收录于《Proceedings of the 34th ACM International Conference on Information and Knowledge Management (CIKM ’25)》。


学术背景

科学领域:本研究属于量化金融与自然语言处理(NLP)的交叉领域,聚焦于投资组合优化(Portfolio Optimization)和大语言模型(LLM)的金融应用。

研究动机
传统的均值-方差优化(Mean-Variance Optimization, MVO)对输入参数(如预期收益和协方差矩阵)高度敏感,而Black-Litterman模型(BLM)通过引入投资者主观视图(Investor Views)缓解了这一问题。然而,如何系统性生成视图仍是核心挑战。现有方法依赖人工经验或简单量化模型,存在主观性强、难以扩展等问题。

研究目标
提出一种基于LLM的视图生成框架,将LLM的收益预测及不确定性量化为BLM的输入(视图向量q和置信矩阵Ω),并通过实证验证其优于传统基准(如等权重组合和MVO)的表现。


研究流程与方法

1. 数据准备

  • 研究对象:标普500指数中市值最大的50只成分股(2024年6月至2025年6月数据)。
  • 数据划分
    • 验证期(3个月):用于调参(超参数τ,平衡市场先验与LLM视图的权重)。
    • 测试期(10个月):评估最终性能。
  • 再平衡周期:每两周调整一次组合权重。

2. LLM视图生成

  • 模型选择:4种LLM(Gemma-7B、Qwen-2-7B、Llama-3.1-8B、GPT-4o-mini),确保知识截断日期早于测试期以避免前瞻性偏差。
  • 结构化提示设计
    • 系统提示:要求LLM基于过去两周的股价数据、行业和市场回报,预测未来两周的平均日收益率。
    • 用户提示:提供具体股票数据(如苹果公司的历史收益率、行业分类等)。
    • 输出约束:强制LLM返回单一浮点数(预测收益率)。
  • 不确定性量化:对每只股票进行100次重复查询,计算预测均值和方差(作为置信水平)。

3. Black-Litterman模型集成

  • 输入转换
    • 视图向量q:LLM预测收益的均值。
    • 挑选矩阵P:单位矩阵(每只股票对应一个绝对视图)。
    • 置信矩阵Ω:LLM预测的方差(反映不确定性)。
  • 后验收益计算:通过贝叶斯框架融合市场均衡收益(CAPM推导)与LLM视图。

4. 组合优化与回测

  • 优化目标:在限制条件下(权重和为1、禁止做空)最大化风险调整后收益。
  • 对比基准:等权重组合(EW)、均值-方差优化(MVO)、标普500指数。
  • 性能指标:累计年化增长率(CAGR)、夏普比率(Sharpe Ratio)、最大回撤(MDD)等。

主要结果

1. 组合绩效(RQ1)

  • 绝对收益:BLM-Qwen和BLM-Llama显著优于基准,CAGR分别为28.11%和27.51%(EW为19.07%,MVO仅6.07%)。
  • 风险调整收益:BLM-Llama的夏普比率(年化1.23)最高,体现其高收益低波动的特性。
  • 下行风险控制:BLM-Qwen的最大回撤(-13.75%)最小,显示其稳健性。

2. LLM投资风格差异(RQ2)

  • BLM-Llama:预测分散度高(标准差0.69),存在极端值(-57.99%至91.70%),体现高置信度分化风格。
  • BLM-Qwen:预测稳定(标准差0.29),偏向谨慎乐观
  • BLM-Gemma:系统性悲观(均值-0.38),导致表现不佳。

3. 市场环境适应性(RQ3)

  • 成功关键:LLM的预测倾向需与市场趋势一致。测试期内市场整体上涨,BLM-Qwen和BLM-Llama的乐观视图更匹配环境,而BLM-Gemma的悲观偏差导致失效。

结论与价值

科学价值
1. 方法论创新:首次提出将LLM预测不确定性量化为BLM的置信矩阵,解决了视图生成的系统性问题。
2. 实证贡献:证明LLM驱动组合可超越传统量化模型,且不同LLM呈现稳定的投资风格。

应用价值
- 资管行业:提供自动化、低主观性的视图生成工具。
- LLM选择策略:提示LLM性能取决于其风格与市场环境的匹配度,而非单一“最优模型”。


研究亮点

  1. 跨学科融合:将NLP前沿技术(LLM)与经典金融模型(BLM)结合,开辟新研究方向。
  2. 可解释性:通过分析LLM预测分布揭示其投资风格,为模型选择提供理论依据。
  3. 开源支持:代码与数据公开于GitHub,促进后续研究复现与扩展。

其他有价值内容

  • 超参数τ的动态调参:通过启发式估计与网格搜索结合,优化市场先验与LLM视图的权重平衡。
  • 预测误差分析:BLM-Qwen的预测误差(MSE 0.5125)最低,与其实际表现正相关,验证框架有效性。

(全文约2000字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com