由同济大学建筑与城市规划学院的何祯、吴志强教授(通讯作者)、德国不来梅大学及德国工程院的Otthein Herzog教授、同济大学设计创意学院的何景皓、中国科学院上海技术物理研究所的李兰以及浙江工业大学设计建筑学院的李想共同完成的研究成果《Compound health effects and risk assessment of extreme heat and ozone air pollution under climate change: A case study of 731 urban areas in China》于2024年12月16日在线发表于国际期刊《Sustainable Cities and Society》(第119卷,文章ID 106084)。
本研究立足于气候变化与城市化进程交织的时代背景,聚焦于由此加剧的极端高温和地表臭氧污染这两个重大环境健康风险。虽然既往研究已分别探讨了极端高温或空气污染对健康的单独影响,但针对二者协同作用的“复合健康效应”(Compound health effect)及其在癌症发病风险中的作用,科学认知尚存在显著空白。同时,传统的风险评估方法往往难以捕捉环境暴露与社会经济脆弱性因素之间复杂的非线性交互作用。因此,本研究旨在:1)揭示极端高温与臭氧污染对癌症发病率的复合影响及内在机制;2)开发一种能够整合复杂非线性关系的创新性城市双环境暴露风险评估框架;3)识别中国城市环境中相关健康风险的高发区域与模式,为制定精准的公共卫生干预策略提供科学依据。
研究采用了严谨、创新的两阶段方法论框架,对中国731个区/县级行政区域(覆盖2017年约30.39%的全国人口)进行了深入分析。
第一阶段:基于可解释空间机器学习的健康效应规律发现
研究首先进行了大规模数据收集与预处理。健康结局数据来源于中国国家癌症中心发布的《2020中国肿瘤登记年报》,获取了2017年各地区所有部位癌症(ICD-10: C00-96, D32–33, D42–43, D45–47)的新发病例数,并计算了每10万人的癌症发病率。环境暴露数据包括:1)极端地表温度:基于经过增强再分析与热红外遥感融合方法优化的MODIS LST日夜间数据集(2002-2021年),以每个地区日、夜间LST的90百分位数作为极端阈值,计算了2013-2017年每年夏季(6-9月)超过该阈值的平均强度(Intensity)和累计总和(Cumulative sum)。2)地表臭氧:采用中国高分辨率空气污染物数据集,计算了2013-2017年夏季日最大8小时平均浓度的平均强度。3)社会生态指标:包括代表适应能力的2017年归一化植被指数(NDVI)、人均住房面积,以及代表敏感性的65岁以上人口比例和城市化率。所有栅格数据均通过ArcGIS区域统计工具聚合至区/县级单元。
随后,研究构建了一个可解释的空间极端梯度提升模型。为了充分捕捉环境与健康数据中的空间异质性和自相关性,研究者在模型中创新性地将地理坐标(经纬度)作为输入特征之一,构建了“空间XGBoost模型”。输入变量包括上述日间/夜间极端LST强度与累计量、地表臭氧强度、NDVI、老龄化比例、人均住房面积和城市化率;输出变量为2017年癌症发病率。模型采用贝叶斯优化进行超参数调优,并利用80/20划分进行训练与测试。模型性能评估显示,其决定系数(R²)达0.8617,均方根误差为29.9071/10万,平均绝对百分比误差为6.8068%,预测准确性优于不考虑空间特征的模型。
为了深入解读这个“黑箱”模型,研究采用了SHAP值进行模型解释。SHAP值源自合作博弈论,能公平分配每个特征对模型预测结果的贡献。通过计算SHAP值,研究者可以:a)评估各特征对癌症发病率的全局重要性;b)结合偏依赖图分析每个特征与癌症发病率之间的非线性关系及阈值效应;c)探究关键特征(如极端高温与臭氧)之间的交互作用。
第二阶段:基于“危险-暴露-脆弱性”框架的城市双环境暴露风险评估
基于第一阶段模型揭示的复杂关系,本研究摒弃了传统风险评估中直接对原始变量进行加权算术平均的方法,提出了一个创新的评估框架——城市双环境暴露风险指数(Urban Dual Environmental Exposure Risk Index, UDEERI)。该框架严格遵循IPCC AR6的风险评估范式,但其核心创新在于使用第一阶段模型计算出的各变量SHAP局部解释值作为构建风险指数的数据基础。因为这些SHAP值已经蕴含了变量之间复杂的非线性相互作用对健康结局的实际影响,从而使得风险评估建立在更符合现实因果关系的科学基础上。
具体构建过程如下: 1. 危险指数:由日间极端LST强度、夜间极端LST强度和地表臭氧强度的SHAP值,根据其在第一阶段模型中的特征贡献比例加权聚合而成。 2. 暴露指数:采用WorldPop提供的2017年百米网格人口密度数据,计算各城市区域内暴露于极端高温阈值以上的人口密度标准化指数。 3. 脆弱性指数:由敏感性(65岁以上人口比例的SHAP值)和适应能力(NDVI和人均住房面积的SHAP值)两个维度,按其贡献比例加权聚合而成。 4. 综合风险指数:通过专家问卷和层次分析法确定了危险、暴露、脆弱性三个维度的相对权重,对上述三个归一化后的指数进行加权聚合,最终得到UDEERI。风险值被划分为高、中高、中、中低、低五个等级,并进行了空间制图。研究还特别分析了风险排名前30位地区的危险-暴露-脆弱性构成模式。
研究取得了多项重要发现。首先,在环境暴露特征方面,中国731个城市的极端LST阈值存在显著空间异质性,西北沙漠、华北、华中、东部沿海及成渝城市群阈值较高,表明全国统一的极端高温标准(如35°C)可能不适用于所有地区。2002-2021年间,日间和夜间极端LST的强度和累计量均呈上升趋势。2013-2017年的空间分布显示,极端高温强度高值区与地表臭氧高值区存在显著空间重叠(皮尔逊相关系数0.53),印证了高温加剧臭氧形成的科学认知。
其次,复合健康效应分析揭示了深刻的机制。全局特征重要性排序显示,城市化率是预测癌症发病率的最强因素,其次便是夜间极端LST强度、NDVI、老龄化比例和地表臭氧强度。这表明社会经济发展模式、夜间热暴露、绿化和人口结构在环境健康风险中扮演关键角色。尤为重要的是,夜间极端高温的影响强于日间,这可能与夜间高温干扰睡眠、影响褪黑素分泌和细胞DNA修复机制有关。
偏依赖图进一步揭示了关键的非线性关系和阈值效应。例如:夜间极端LST强度在约25°C时,其SHAP值由负转正,超过此阈值癌症风险显著上升;地表臭氧强度在约90 µg/m³时发生类似转折。NDVI在0.55以上时表现出显著的癌症风险降低效应;人均住房面积超过48平方米能显著缓解风险。交互作用分析证实了极端高温与臭氧的协同放大效应:当日间极端LST强度超过38.78°C且臭氧超过90.57 µg/m³,或夜间极端LST超过28.38°C且臭氧超过102.44 µg/m³时,癌症发病率会显著跃升。此外,当NDVI值达到或超过0.58时,其对环境负面健康影响的调节作用更加明显;而老龄化比例超过14.56%会显著放大地区对上述环境阈值的脆弱性。
最后,风险评估结果清晰展现了风险的空间分异格局。高风险区域(UDEERI高值区)主要集中在西北沙漠地区、华中地区、东部沿海以及成渝城市群。这些区域通常表现为高环境危险(极端高温与臭氧污染严重)、高人口暴露和/或高脆弱性(老龄化严重、绿化不足或居住拥挤)的多重叠加。对前30名高风险地区的模式分析发现,有的城市是“高危险-高暴露-中脆弱性”,有的则是“高危险-中暴露-高脆弱性”,这提示需要差异化的风险应对策略。相比之下,中国南部和西南部多数城市风险较低。
本研究的主要结论是:气候变化背景下,极端高温与臭氧污染的共同暴露对人群健康(特别是癌症发病风险)构成了显著的复合威胁,其影响存在明确的非线性关系和交互增强的阈值效应。夜间高温、城市化进程和人口老龄化是加剧风险的关键因素,而城市绿化和充足的居住空间则展现出重要的风险缓解能力。研究创新性地将可解释机器学习与IPCC风险评估框架深度融合,所开发的UDEERI指数能够更科学地量化复杂的环境健康风险,识别高风险区域及其风险构成模式。
本研究的亮点和价值体现在多个方面:科学价值上,它首次在中国大尺度范围内系统量化了极端高温与臭氧污染对癌症发病率的复合健康效应,填补了该领域的研究空白,深化了对多环境应激源协同作用机制的理解。方法论创新显著,创造性地将空间XGBoost模型与SHAP解释性分析结合,并利用模型输出的SHAP值重构风险评估指标,使得风险评估从简单的线性加权迈向基于真实数据驱动关系的非线性综合,为环境健康风险评估提供了新范式。应用价值突出,研究明确指出了需要优先关注的高风险区域和人群(如夜间高温显著的地区、老龄化严重的城市),并识别了关键的環境暴露阈值和脆弱性转折点(如NDVI > 0.58,老龄化比例 > 14.56%),这为城市规划者、公共卫生部门制定精准的适应与减缓措施(如针对性增加绿地、改善夜间热环境、加强老年人群健康防护)提供了直接、可靠的决策支持,有助于推动可持续与健康城市的建设。
当然,研究也指出了其局限性,如健康结局数据仅有一年,未能分析长期趋势;未纳入PM2.5等其他污染物及其与高温的交互作用;对暴露与健康结局间的时滞效应探索有限。未来的研究可通过纳入多年份数据、更多污染物指标以及动态模型来进一步完善。