本研究由来自比利时鲁汶大学信息系统工程研究中心(LIRIS)的 Larry Van Wallendael, Line Vanneste, Yanyi Zhang, Alexander Stevens 以及通讯作者 Johannes De Smedt 共同完成。研究论文《Mitigating Downside Risk: ESG Integration in Portfolio Construction with Stock Preselection Using Machine Learning and Mean-CVaR Optimization》发表于学术期刊 Quarterly Review of Economics and Finance 的第106卷(2026年)。该研究旨在探讨将环境、社会和治理(Environmental, Social, and Governance, 简称ESG)因素整合到投资组合构建中,对于降低极端下行风险的有效性。研究采用了一个包含股票预选和投资组合优化的双阶段框架。
研究学术背景 本研究属于金融学、投资组合管理和可持续金融交叉领域。过去十年,ESG因素在金融决策中的重要性显著提升。大量研究探讨了ESG与公司财务表现的关系,但结论不一。近期研究的一个新兴共识是,ESG表现与公司的下行风险(即极端损失风险)存在关联。具体而言,高ESG评分的公司往往展现出更好的尾部风险保护能力。然而,关于如何系统地将ESG整合到投资组合构建流程中以降低整个投资组合(而非单只股票)的极端风险,相关研究仍然有限。现有研究要么使用次优的风险度量指标,要么缺乏一个完整的、包含筛选和优化环节的整合框架。因此,本研究旨在填补这一空白,探究在一个包含机器学习股票预选和条件在险价值(Conditional Value-at-Risk, 简称CVaR)优化的双阶段框架内,不同的ESG整合策略(线性整合与负面筛选)对降低投资组合下行风险的效果。研究主要回答两个核心问题:1. 相较于无ESG整合的方法,采用ESG整合构建的投资组合对极端投资风险有何影响?2. 与ESG负面筛选方法相比,采用线性ESG整合构建的投资组合对极端投资风险有何影响?
详细研究流程 本研究遵循一个结构严谨的双阶段实验流程:股票预选阶段和投资组合优化阶段,实验管道如图1所示。 第一阶段:股票预选 1. 数据准备:研究使用从标普100指数中随机选取的50只股票,时间段为2009年12月31日至2020年12月30日。数据包括每日价格、交易量以及Refinitiv提供的年度ESG评分。研究计算了七种技术指标作为机器学习模型的输入特征,包括简单移动平均线(Simple Moving Average, SMA)、指数移动平均线(Exponential Moving Average, EMA)、成交量加权平均价(Volume Weighted Average Price, VWAP)、异同移动平均线(Moving Average Convergence Divergence, MACD)、相对强弱指数(Relative Strength Index, RSI)、布林带上轨(Bollinger Bands Upper)和下轨(Bollinger Bands Lower)。数据被分为两部分:用于模型训练和组合构建的“样本内”数据(至2018年12月,共2265个交易日),以及用于评估的“样本外”数据(2019年1月至2020年12月,共502个交易日)。样本外数据又细分为市场稳定的2019年和高波动的2020年(COVID-19时期),以测试模型在不同市场环境下的表现。 2. ESG整合方法定义: * 线性ESG整合(ESG-informed Returns):本研究采用Lauria等人(2022)提出的方法,将ESG评分线性嵌入到股票回报中,形成“ESG-informed收益”。具体公式为:𝜖𝑖,𝑡 = 𝜆 · (𝑐𝑖,𝑡 / 𝑑) + (1 − 𝜆) · 𝑟𝑖,𝑡。其中,𝑟𝑖,𝑡 是股票 i 在日 t 的实际收益率;𝑐𝑖,𝑡是标准化到[-1, 1]区间的ESG评分;𝑑是一个缩放因子(本研究设为252,近似年交易天数),用于使ESG评分调整项与收益率的量级可比;𝜆是“亲和度参数”,介于0到1之间,代表投资者对ESG的重视程度。𝜆=0意味着不考虑ESG,𝜆=1则完全由ESG评分驱动。本研究测试了𝜆=0.25, 0.5, 0.75, 0.99四种配置。ESG评分每年更新,采用“向前填充”法应用于每日数据,以避免前瞻性偏差。 * 负面筛选(ESG Screening):作为对比方法,在股票预选前,首先剔除ESG评分最低的20只股票(从50只中剔除),然后在剩余的30只股票中进行预选。此步骤使用的是原始资产收益,而非ESG-informed收益。 3. 机器学习模型与预测:研究采用了五种常用的机器学习模型来预测股票的下一个交易日收益率:支持向量回归(Support Vector Regression, SVR)、极端梯度提升(Extreme Gradient Boosting, XGBoost)、随机森林(Random Forest, RF)、多层感知器(Multilayer Perceptron, MLP)和长短期记忆网络(Long Short-Term Memory, LSTM)。对于每种ESG整合类别(无ESG、不同𝜆值、负面筛选),研究分别使用这些模型进行预测。模型使用80/20的比例划分训练集和验证集进行超参数调优。预测的目标是次日收益率,输入特征是基于前一日(LSTM为前五日)数据的七个技术指标。一个“幼稚预测器”(Naïve Forecaster,即假设明日收益率等于今日收益率)被用作基准模型。 4. 股票选择:基于模型预测的次日收益率,从候选股票池(对于非筛选方法为50只,对于负面筛选方法为30只)中选出预测表现最好的前10只股票,进入下一阶段的投资组合优化。选择10只股票是基于现有文献中关于个人投资者组合规模的常见设定。
第二阶段:投资组合优化 1. 优化模型构建:研究采用均值-条件在险价值(Mean-CVaR)优化模型来构建最终投资组合。CVaR是比传统风险价值(Value-at-Risk, VaR)更优的下行风险度量,它衡量的是损失超过VaR阈值时的平均损失,能更好地捕捉尾部风险。优化问题的目标是在给定置信水平(本研究为95%)下最小化投资组合的CVaR。约束条件包括:投资组合权重之和为1(完全投资)、禁止卖空(权重非负)、以及要求投资组合的实际金融收益率(基于原始收益计算,而非ESG-informed收益)必须不低于一个预设的最低目标回报率(𝑟0)。这个约束确保了优化过程在纳入ESG考量的同时,组合的金融表现仍具竞争力。 2. 优化求解与部署:优化问题基于Rockafellar和Uryasev(2000)提出的线性规划(Linear Programming, LP)公式进行求解,具体实现使用了CVXPY工具包和Clarabel求解器。在样本内阶段,对不同的目标回报率(𝜇从0.0004到0.0008)进行优化,绘制出风险-收益的有效前沿。在样本外阶段,使用训练好的模型预测测试期数据,基于预测的ESG-informed收益进行优化,得到权重,然后用这些权重和股票在测试期的实际收益来计算组合的真实表现(包括CVaR和收益率),以评估策略的实战效果。
主要研究结果 1. 股票预选结果:通过均方根误差(Root Mean Square Error, RMSE)评估预测精度。结果显示,随机森林(RF)和XGBoost(XGB)在大多数ESG整合类别中表现最佳(RMSE最低)。一个关键发现是,随着𝜆值增大(即更重视ESG),除了LSTM外,其他机器学习模型的预测误差普遍降低。这是因为ESG评分相对稳定(每年更新),而股票收益率波动剧烈,更高的𝜆值意味着模型预测中波动性成分降低,因此更容易预测。当𝜆=0.99时,幼稚预测器的表现甚至超过了所有复杂模型,印证了这一点。 2. 样本内风险表现(有效前沿分析):分析不同投资组合规模(6、8、10只股票)下,各种ESG整合策略的有效前沿(即在给定目标收益率下的最小CVaR)。主要结论包括: * 𝜆=0.99的表现普遍很差,在所有组合规模中有效前沿都最高(风险最大),因此被排除在进一步分析之外。 * 线性ESG整合 vs. 无ESG:𝜆=0.5的配置在绝大多数情况下(不同组合规模、不同目标收益率)都优于无ESG的组合(即有效前沿更低),这表明线性ESG整合具有降低风险的潜力。𝜆=0.25和0.75的表现则与目标收益率有关,有时优于无ESG,有时稍差。 * 负面筛选 vs. 无ESG:结果不明确,在6只股票组合中负面筛选略优,但在8只和10只股票组合中,无ESG组合往往表现更好。作者分析,这可能是因为剔除股票(负面筛选)带来了机会成本,尤其是在构建较大规模组合时,可能排除了某些有潜在贡献的股票。 * 线性ESG整合 vs. 负面筛选:总体而言,𝜆=0.5和0.75的线性整合方法 consistently 优于负面筛选方法。 3. 样本外风险表现:这是研究的核心验证环节。结果被分为新冠疫情前(2019年,低波动)和疫情中(2020年,高波动)两个时期进行对比分析。 * 疫情前(2019):线性ESG整合策略(特别是𝜆=0.25和0.5)普遍优于无ESG策略。负面筛选与无ESG策略相比结果不一。线性ESG整合策略的表现均优于负面筛选。 * 疫情中(2020):在波动剧烈的市场环境下,ESG整合的风险缓释作用更加凸显。𝜆=0.5,0.75,甚至0.99的配置都持续优于无ESG策略。这表明在市场危机期间,给予ESG因素更高权重的投资组合展现出更强的抗风险能力。负面筛选相对于无ESG的优势依然不明显。线性ESG整合策略(尤其是𝜆=0.5和0.75)继续跑赢负面筛选策略。 * 核心对比发现: * 对于研究问题一(RQ1):ESG-informed收益(线性整合)有效地降低了投资组合的下行风险,且这种效应在市场高波动时期(如新冠疫情)更为显著。 * 对于研究问题二(RQ2):在降低下行风险方面,线性ESG整合方法 consistently 优于ESG负面筛选方法。
研究结论与价值 本研究的核心结论是,在一个结合机器学习股票预选和均值-CVaR优化的双阶段框架内,通过将ESG评分线性嵌入资产收益(ESG-informed Returns)的方式进行整合,能够有效降低投资组合的极端下行风险,尤其是在市场波动性较高的时期。而传统的ESG负面筛选方法,在本研究框架下,并未显示出明确且一致的风险降低优势。
研究的科学价值在于,它首次尝试在一个完整的、包含预测和优化的双阶段框架中,系统比较了两种主流ESG整合策略(线性整合与负面筛选)对投资组合尾部风险管理的效果,并提供了详尽的实证证据。这为理解ESG因素如何通过量化模型影响投资组合风险结构提供了新的视角和方法论。
研究的应用价值显著。对于资产管理从业者而言,本研究指出,与其简单地排除“不达标”公司(负面筛选),不如采用更精细化的方法,将ESG评分作为一个风险调整因子直接纳入资产预期收益的建模和组合优化过程中(线性整合),这样可以更有效地构建具备下行风险抵御能力的可持续投资组合。特别是在预期市场将出现动荡时,提高ESG因素的权重(即使用更高的𝜆值,如0.5或0.75)可能是一种有益的风险管理策略。
研究亮点 1. 方法创新性:这是首个在双阶段(预选+优化)框架内,综合运用多种机器学习技术和均值-CVaR优化,并系统比较线性ESG整合与负面筛选对投资组合下行风险影响的研究。研究设计严谨,对比维度丰富(不同𝜆值、不同机器学习模型、不同市场环境)。 2. 重要发现:明确指出了线性ESG整合在风险管理上优于负面筛选,并揭示了ESG的风险缓释效应在市场危机期间的增强现象。这对当前主流的ESG投资实践(如负面筛选基金)提出了基于实证的反思。 3. 实践指导意义:研究不仅证明了ESG整合对风险管理的价值,还提供了可操作的具体参数(如𝜆的设定)和方法流程,对量化可持续投资策略的开发具有直接的参考意义。
其他有价值内容 研究也坦率地讨论了其局限性,为未来研究指明了方向: 1. 计算复杂度高,限制了使用更复杂机器学习模型(如深层LSTM)的可能性。 2. 将ESG同时应用于预选和优化两个阶段,使得结果归因(到底是哪个阶段贡献了风险降低)变得复杂。未来可分离这两个阶段的影响进行更精细的分析。 3. 线性ESG整合公式可能会平滑收益的波动性(因为ESG评分变化缓慢)。未来研究可探索能保持收益波动特性的ESG整合公式。 4. 本研究未考虑投资组合再平衡(Rebalancing)的影响,未来可将其纳入分析框架。