分享自:

基于制度转换自适应后验动态因子模型的股票收益预测

期刊:Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence

学术研究报告:RSAP-DFM:一种用于股票收益预测的体制转移自适应后验动态因子模型

本研究报告围绕一篇发表于《第三十三届国际人工智能联合会议论文集》(Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence, IJCAI-24)的学术论文展开。论文题目为《RSAP-DFM:用于股票收益预测的体制转移自适应后验动态因子模型》。该研究由来自复旦大学(Fudan University)的向全舟(Quanzhou Xiang)、陈湛(Zhan Chen)、孙琦(Qi Sun)和蒋汝骏(Rujun Jiang)四位研究者共同完成。

一、研究背景与目的

资产定价是现代金融研究的核心议题,旨在解释不同资产预期回报的截面差异。自Fama-French三因子模型引领了因子模型时代以来,传统因子模型倾向于将因子暴露视为静态的。然而,现实投资绩效受到时变因素的影响,动态因子模型(Dynamic Factor Model, DFM)因此受到重视。与此同时,机器学习技术的发展为捕捉复杂的金融关系提供了更强大的非线性建模框架。将机器学习应用于资产定价,以提升因子模型的预测性能,已成为近年来的研究热点。

然而,当前研究仍面临两大挑战。首先,在复杂多变的经济环境下,投资模型成功的关键在于能否及时判断宏观经济状态(regime)并将其整合到投资决策中。现有机器学习及动态因子模型大多难以有效封装这一特性。先前工作或采用黑箱集成方式,或将经济特征离散化为少数市场状态,这些处理方式被认为不够精确。其次,传统数据驱动的因子构建容易受到股票数据低信噪比的污染,导致准确预测收益变得困难。

为此,本研究提出了一种全新的股票收益预测框架,名为“体制转移自适应后验动态因子模型”(Regime-Shifting Adaptive Posterior Dynamic Factor Model, RSAP-DFM)。该模型旨在重塑因子构建、因子收益与因子暴露之间的关系,通过创新的架构设计,实现连续区间而非离散的宏观经济状态(体制)的识别与转移,并将这种宏观模式显式地映射到股票收益预测中,而非采用黑箱处理。

二、研究流程与方法详解

RSAP-DFM模型的整体流程是一个精心设计的、包含多个协同组件的深度学习系统。其核心思想是通过双重的、连续区间的体制转移(Dual Regime Shifting),将自适应提取的宏观经济信息动态注入到一个具有鲁棒性的动态因子模型中,并通过一个创新的双层优化算法进行训练。

流程一:特征嵌入提取 研究对象是股票市场的历史时序数据。具体而言,对于任意交易日t,模型输入 (x_t \in \mathbb{R}^{n_t \times b \times f}),表示过去b个时间步(文中设定为60天)内 (n_t) 支股票的f个特征(如开盘价、最高价、最低价、收盘价、成交量加权平均价格、交易量)。目标是预测这些股票在下一个交易日的截面收益 (r_t \in \mathbb{R}^{n_t})。 1. 股票特征构建:首先,使用门控循环单元(GRU)网络从原始时序特征 (x_t) 中提取股票的隐状态 (ht),记为 (e)。GRU能够有效捕捉时间序列中的长期依赖关系。 2. 双重体制转移编码结构:这是本研究的核心创新之一。研究者认为,体制转移在动态因子模型中扮演双重角色:一是影响整体市场回报,进而影响因子收益;二是对个股的回报产生不同程度的影响,从而改变个股的因子暴露。模型并未引入额外的宏观数据,而是从上述股票隐状态 (e) 中动态提取宏观经济特征 (m),即 (m = \phi{dm}(e))。 * 体制转移跳跃编码器:该编码器 (\phi{rj}) 的作用是捕捉当前体制如何影响每个因子的收益。它将提取的低维宏观特征 (m) 进一步投影到K维空间(K为因子数量),得到编码 (e{rj}),用于后续影响因子收益。 * 体制转移载荷编码器:该编码器 (\phi{rl}) 的作用是刻画体制转移对因子载荷(即因子暴露和个股特质收益)的影响。与跳跃编码器不同,它需要结合股票的个体特征 (e),输出两个向量:(l\alpha) 表示体制对股票特质收益 (\alpha) 的载荷影响,(l_\beta \in \mathbb{R}^{n \times k}) 表示体制对股票因子暴露 (\beta) 的影响。

流程二:基于多头注意力的先验因子编码器 为了增强模型的鲁棒性并摒弃人工构建因子的过程,研究者设计了一个变分编码器 (\phi{prior}),从股票隐状态中提取先验因子 (\lambda{prior}),并将其建模为服从正态分布的随机变量。 1. 因子挖掘的双视角:传统因子投资中,因子构建(因子值计算)和因子收益(通过多空组合获得)是分离的。本模型将二者统一在一个端到端的编码过程中。 2. 多头注意力机制:使用一个多头注意力机制 (\phi{att}) 来表征因子构建部分因子收益。该机制通过计算查询(query)与各股票隐状态键(key)之间的相关性,生成注意力权重,然后对值(value)进行加权聚合,形成多个注意力头的输出,最后拼接起来得到 (h{multi})。这模拟了从众多股票信息中提炼出共同风险因子的过程。 3. 合并与采样:将多头注意力输出 (h{multi}) 与体制转移跳跃编码器的输出 (e{rj}) (表征宏观对因子收益的影响)通过一个投影网络 (\pi{prior}) 合并,生成先验因子分布的均值 (\mu{prior}) 和标准差 (\sigma{prior})。最终,先验因子通过从该正态分布中采样得到:(\lambda{prior} \sim \mathcal{N}(\mu{prior}, \text{diag}(\sigma{prior}^2)))。

流程三:双重动态因子模型 在获得先验因子后,模型构建了一个“双重动态因子模型”来预测股票收益。该模型在传统动态因子模型 (r̂ = α + βλ) 的基础上,显式地引入了体制转移载荷 (l\alpha) 和 (l\beta)。 1. Alpha层:用于生成股票的特质收益 (\alpha)。该层认为 (\alpha) 也服从高斯分布,其均值和标准差由一个分布网络 (\pi\alpha) 从股票隐状态 (e) 中生成。 2. Beta层:用于计算股票的因子暴露 (\beta)。这是一个从股票隐状态 (e) 到K维因子暴露空间的线性映射。 3. 显式体制映射:将体制转移的影响以“逐元素乘法”的形式注入模型:(r̂ = l\alpha \alpha(e) + l\beta \beta(e) \lambda)。这意味着,宏观状态信息 (l\alpha) 和 (l\beta) 直接调整了每个股票的特质收益和其对每个因子的暴露程度。由于市场信息(体制)和因子模型参数都是动态的,故称为“双重动态”因子模型。 4. 预测收益分布:最终,每支股票的预测收益 (r̂^{(i)}) 也被表征为一个高斯分布,其均值和方差由 (l\alpha, l\beta, \alpha, \beta, \lambda{prior}) 的分布参数共同决定。

流程四:自适应因子后验模块 为了进一步提高先验因子的鲁棒性,研究者引入了一个基于梯度的后验因子构建模块,其思想来源于对抗性学习(Adversarial Learning)。 1. 构造对抗性扰动:在每次训练迭代中,计算主预测任务损失(预测收益 (r̂) 与实际收益 (r) 的均方误差)关于先验因子 (\lambda_{prior}) 的梯度 (g^*)。 2. 生成后验因子:沿着梯度方向添加一个小的扰动,构造出一个对抗性因子 (\lambdag = \lambda{prior} + \epsilon \frac{g^}{|g^|})。这个扰动旨在寻找能使预测发生最大变化的方向,从而让模型学习到的因子在面对此类“最坏情况”扰动时仍然保持预测稳定性。

流程五:双层优化算法 研究的一个关键创新是将模型训练构建为一个双层优化问题,通过引入后验因子构造一个辅助训练任务来提升主任务的性能。 1. 参数分割:将模型参数分为两部分:(\theta_c)(因子构建部分,包括先验和后验因子编码器参数)和 (\theta_d)(双重动态因子模型部分参数)。 2. 优化目标:外层优化目标是最小化主任务损失 (l_m)(预测收益与实际收益的MSE),但优化的是 (\theta_d)。内层优化目标是在固定 (\theta_d) 的情况下,优化 (\theta_c) 以最小化辅助任务损失 (l_a)。 3. 辅助任务:本研究中设计的辅助任务损失 (l_a) 结合了对抗性后验因子的预测损失和主任务的预测损失:(la = \text{MSE}(ϕ{ddf}(e, m, \lambda_g), r) + \text{MSE}(r̂, r))。这迫使因子构建部分能够产生不仅本身预测效果好,而且在面对对抗性扰动时依然鲁棒的因子。 4. 两阶段交替训练:训练过程采用交替更新的策略(如算法1所示):先在一个批次的数据上固定 (\theta_d),用辅助任务损失更新 (\theta_c);再在另一个批次的数据上固定 (\theta_c),用主任务损失更新 (\theta_d)。这种设计模仿了传统金融中因子构建与因子模型优化分离的思想,但通过梯度实现了端到端的联合学习。

三、主要实验结果与逻辑关联

研究在中国A股市场(沪深100、沪深300、沪深500指数成分股)的真实数据上进行了广泛实验,时间跨度为2008年至2020年。评估指标采用了信息系数、信息系数比率、秩信息系数及其比率等学术界常用指标。

  1. 整体性能验证(回答研究问题1):如表2所示,RSAP-DFM在三个数据集的所有四个预测指标上均全面领先于包括XGBoost、LightGBM、各类先进的深度学习模型(Transformer、ALSTM、GATS、AdaRNN等)以及最新的因子模型(FactorVAE)在内的所有基线模型。这一结果有力地证明了RSAP-DFM框架在股票收益预测方面的有效性和优越性,达到了新的最先进(state-of-the-art, SOTA)性能。

  2. 消融实验(回答研究问题2 & 3):通过构造不同的模型变体进行对比,验证了各核心组件的必要性。

    • 双层优化的有效性:对比“仅使用主任务的端到端优化模型(RS-DFM)”和“使用双层优化的RSAP-DFM”,后者性能更优(表3)。这表明,引入基于对抗性后验因子的辅助任务和双层优化框架,确实能有效提升模型性能。
    • 双重体制转移架构的有效性:对比“无跳跃编码器”和“无载荷编码器”的变体,完整的RSAP-DFM模型表现最好(表3)。这证实了双重体制转移设计的必要性:同时考虑宏观状态对因子收益和因子暴露的影响,比单一考虑或完全不考虑能更好地捕捉宏观隐藏信息,并为模型提供更强的鲁棒性和准确性。
  3. 后验因子构建方法比较(回答研究问题4):研究者将提出的梯度对抗后验因子 (\lambda_g) 与另一种基于投资组合收益的后验因子构建方法(记为 (\lambda_r))进行了对比。后者是近期研究(如Gu et al., 2021; Duan et al., 2022)中采用的方法,通过构建投资组合并映射其收益来得到后验因子。实验设计了三种使用 (\lambda_r) 的辅助任务作为基线((\ell1_a, \ell2_a, \ell3_a))。表4显示,使用梯度对抗后验因子 (\lambda_g) 的RSAP-DFM(即本模型)在大多数指标上表现最优或极具竞争力。这表明,基于梯度的对抗性扰动方法在构建能提升模型鲁棒性的后验因子方面,是一种有效且优越的策略。

  4. 投资绩效验证(回答研究问题5):为了将预测性能转化为实际经济效益,研究采用了最常见的多空投资策略。根据模型预测的股票排名,做多排名最高的一组股票,做空排名最低的一组股票,并每日调仓。图2展示了在测试期内,RSAP-DFM构建的投资组合实现了显著高于所有基线模型的累计多空收益夏普比率。这直接证明了模型卓越的预测能力能够转化为卓越的投资盈利能力。

四、研究结论与价值

本研究成功提出了一个名为RSAP-DFM的创新性股票收益预测框架。其核心贡献在于: 1. 首次提出了基于连续区间体制转移的双重动态因子模型:摒弃了将市场状态离散化的传统做法,实现了宏观经济状态在连续区间内的自适应提取与转移,并通过跳跃编码器和载荷编码器显式地将宏观信息映射到因子收益和因子暴露中,显著提升了模型的解释性。 2. 引入了基于梯度的后验因子构建与双层优化:通过对抗性学习思想构造后验因子,并采用新颖的两阶段双层优化算法进行训练,有效增强了因子构建的鲁棒性,优化了最终预测回报。 3. 重构了因子模型内部关系:利用多头注意力机制和正态分布采样,实现了因子构建与因子收益的端到端学习,摒弃了人工因子构建过程。

该研究的科学价值在于为动态因子模型和机器学习在金融中的应用提供了全新的视角和方法论。它表明,将宏观经济体制以连续、显式、双重影响的方式整合到深度学习框架中是可行且高效的。其应用价值则直接体现在股票收益预测和量化投资策略的绩效提升上,实验证明其能够超越现有主流方法,产生显著的超额收益。

五、研究亮点

  1. 方法论创新:连续体制转移、显式宏观映射、梯度对抗后验因子、双层优化算法,这些均是本文首创或首次在神经网络训练框架中应用于动态因子模型的概念和方法。
  2. 性能突破:在多个真实股票数据集上实现了全方位的SOTA预测性能,并通过投资回测验证了其卓越的经济效益。
  3. 解释性增强:相对于许多“黑箱”机器学习模型,RSAP-DFM通过体制转移编码器提供了宏观经济如何影响股票收益的可解释路径,尽管其整体仍是一个复杂模型,但在此方向上前进了一步。

六、其他

论文在“相关工作”部分系统回顾了深度学习在技术分析领域的应用以及因子模型的发展历程,清晰地定位了本研究的学术位置。同时,论文也指出了未来研究方向,包括进一步验证所提双重体制转移方法的普适性,并将其应用于其他领域。

RSAP-DFM是一项融合了金融理论、机器学习前沿技术和创新模型设计的优秀研究,为资产定价和量化金融领域贡献了重要的新思路和新工具。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com