分享自:

AlphaForge:一种挖掘和动态组合公式化Alpha因子的框架

期刊:Association for the Advancement of Artificial Intelligence

本文档属于类型a,即报告一项原创性研究的学术论文。以下是针对该研究的详细学术报告:


AlphaForge框架:一种挖掘并动态组合公式化Alpha因子的创新方法

第一作者及机构
本研究的核心团队由Hao Shi(中国科学院大学计算机科学与技术学院)、Weili Song(湖南大学金融发展与信用管理研究中心)、Xinting Zhang(中国科学院大学)等来自中国、加拿大多所高校及金融机构的研究者共同完成。论文发表于2025年AAAI人工智能会议(AAAI-25)。

学术背景
研究领域为量化投资中的Alpha因子挖掘(Alpha Factor Mining)。金融数据具有高噪声、低信噪比的特性,传统方法(如Fama三因子模型)因市场适应性不足而逐渐失效。现有方法(如遗传编程和强化学习)虽能生成固定权重的Alpha因子组合,但无法应对金融市场的动态变化。本研究旨在解决两大核心问题:
1. 因子性能不一致性:单一因子在不同市场周期表现波动;
2. 固定权重局限性:静态组合难以适应市场风格切换。
目标是通过两阶段框架AlphaForge,实现因子挖掘与动态组合的协同优化。

研究流程与方法
研究分为因子挖掘动态组合两阶段,具体流程如下:

1. 因子挖掘模型
- 研究对象:中国A股市场的CSI300和CSI500成分股(2010-2022年数据),原始特征包括开盘价、成交量等6类时序数据。
- 生成-预测网络结构
- 生成器(Generator):输入高斯噪声,通过Gumbel-Softmax生成公式化Alpha因子的One-hot矩阵(最大长度s=30)。
- 预测器(Predictor):作为代理模型,学习因子性能分布(以IC为评价指标)。
- 创新算法
- 多样性损失函数(Diversity Loss):通过惩罚高相关性因子避免局部最优(公式4)。
- 动态评分函数π:结合IC绝对值与因子库(Factor Zoo)的冗余度筛选新因子(公式5)。

2. 动态组合模型
- 动态权重调整:每日根据因子近期表现(IC、Rank IC等)重新排序,选择Top-N因子拟合线性回归模型。
- 关键创新
- 因子时序动量效应:近期表现优异的因子被赋予更高权重;
- 实时适应性:通过算法2实现“即挖即用”(Mine-as-you-use)策略。

实验设计
- 对比方法:遗传编程(GP)、深度符号优化(DSO)、强化学习(RL)及XGBoost等机器学习基准。
- 评估指标:IC(信息系数)、Rank IC及模拟交易收益。
- 动态池测试:验证因子库规模(1-100)对性能的影响。

主要结果
1. 因子挖掘性能
- 在CSI300数据集上,AlphaForge的IC达4.40%(±0.56%),显著优于RL(2.09%)和DSO(2.55%)。
- 因子库规模实验显示,动态选择10个因子时性能最优(图2),表明过多因子会导致信息冗余。

  1. 动态组合效果
    • 案例研究(表2-3):同一因子在不同交易日的权重差异显著(如因子3权重从-0.00014变为0.00168),验证了动态调整的有效性。
    • 模拟交易:2018-2022年回测中,AlphaForge组合年化超额收益达21.68%,净值曲线(图3)远超基准模型。

结论与价值
1. 科学价值
- 提出首个融合生成式网络与动态时序组合的Alpha因子框架,解决了传统方法在稀疏搜索空间中的低效问题。
- 通过梯度优化实现“定向挖掘”,突破了遗传编程的随机性限制。

  1. 应用价值
    • 实际投资中,框架已通过3百万人民币实盘验证,持续产生超额收益。
    • 可扩展至交通流量预测、销售预测等领域(见Discussion部分)。

研究亮点
- 方法论创新:将符号回归(Symbolic Regression)与深度学习结合,开发可微分公式生成器。
- 动态性突破:首次引入因子时序动量(Temporal Momentum)的权重调整机制。
- 开源贡献:代码发布于GitHub(https://github.com/dulyhao/alphaforge)。

其他发现
- 用户调研显示,动态组合模型因其可解释性(Interpretability)更受机构投资者青睐(补充材料)。
- 因子表达式分析揭示,高频量价相关性特征(如ts_corr(high,volume,5))对短期预测贡献显著。


本报告完整呈现了研究的学术逻辑与技术细节,可作为领域内研究者参考的权威综述。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com