基于可见光至短波红外数据的机器学习地表比辐射率反演方法研究报告
一、 研究团队与发表信息
本研究的主要作者为Xiujuan Li(第一作者,单位:中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室、中国科学院大学)、Hua Wu(通讯作者,单位:电子科技大学资源与环境学院、中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室、中国科学院大学),以及Li Ni, Jing Li, Xingxing Zhang, Dong Fan, Yuanliang Cheng等多位合作者。该研究成果以题为“A practical machine learning approach to retrieve land surface emissivity from space using visible and near-infrared to short-wave infrared data”的论文形式,于2024年发表在期刊《International Journal of Applied Earth Observation and Geoinformation》上。
二、 学术背景与研究目标
本研究属于热红外遥感领域,聚焦于地表比辐射率(Land Surface Emissivity, LSE)这一关键参数的反演。LSE是地物固有的热辐射特性,在不同热红外通道中携带独特的地表信息,对于精确估算地表温度、地表能量收支、资源勘探和土地覆盖变化监测等应用至关重要。然而,现有的LSE反演方法(如物理方法中的温度与发射率分离算法TES、昼夜法,以及半经验方法中的分类法、植被覆盖模型VCM和NDVI阈值法)在适用性或精度上存在局限。物理方法通常需要多个热红外通道甚至中红外通道数据,对传感器要求高且依赖于精确的大气校正;半经验方法(如NDVI阈值法)虽然计算简单,但在纯裸土区适用性差,且未能充分利用更丰富的光谱信息。此外,对于LSE反演中各种参数(特别是可见光至短波红外VNIR-SWIR数据)的相对重要性尚不明确。
针对这些挑战,本研究旨在提出一种实用且可移植的LSE反演方法。具体目标包括:1)利用像元尺度的VNIR至SWIR数据,分析LSE反演的关键参数;2)基于机器学习技术,建立从VNIR-SWIR数据直接估算三个特定热红外通道(中心波长约8.6 μm、11.0 μm和12.0 μm)LSE的模型;3)评估所提出方法的精度、稳健性、普适性以及在不同时间和不同传感器(如Landsat 8)上的可移植性。
三、 详细研究流程与方法
本研究的工作流程系统而严谨,主要包括以下几个步骤:
第一步:研究区选择与数据准备。 考虑到LSE的全球变化特性,研究根据土地分类和柯本气候分类,在全球范围内选择了11个研究区域(对应MODIS正弦投影网格编号,如H10V08、H24V06等),覆盖了赤道、干旱、温暖、冰雪和极地五种主要气候带,以及干旱与暖温带混合区,以确保数据能全面代表全球多样的地表和土壤条件。研究主要使用了两种MODIS产品:作为LSE参考真值的MOD21A1D地表温度与发射率产品(包含8.55 μm、11.03 μm和12.02 μm三个通道的LSE),以及作为模型输入数据的MOD09GA地表反射率产品(包含蓝、绿、红、近红外及三个短波红外通道共7个波段)。为捕捉季节动态,下载了2019年每月一天的数据。同时,为增加地表类型信息,从反射率数据计算了增强型植被指数(EVI)、归一化差异植被指数(NDVI)、归一化差异水体指数(NDWI)、归一化建筑指数(NDBI)、归一化多波段干旱指数(NMDI)、归一化差异雪指数(NDSI)等六个光谱指数,并加入了观测天顶角(VZA)的余弦值作为变量,以考虑角度效应。所有数据经过严格的质量控制,包括剔除无效值、异常值以及利用Sobel算法识别并移除不同地类边界像元以确保表面均一性。最终,构建了包含超过4400万个样本对的总数据集。
第二步:机器学习模型构建与关键变量分析。 研究采用梯度提升回归树(Gradient Boosted Regression Tree, GBRT) 作为核心机器学习算法。GBRT是一种迭代的集成学习算法,通过组合多个弱学习器(决策树)并聚焦于之前模型的残差进行训练,能有效拟合复杂的非线性关系。研究将总数据集的70%用作训练集,30%用作测试集。通过网格搜索(Grid Search) 结合三折交叉验证,对GBRT模型的关键超参数(如弱学习器最大数量、学习率、树的最大深度、节点分裂所需最小样本数等)进行调优,以获得最优模型配置。
在模型构建基础上,研究进行了深入的变量重要性分析。首先,通过皮尔逊相关性分析,探究了所有VNIR-SWIR变量与三个热红外通道LSE的相关性。结果显示,LSE与短波红外第三波段(SWIR3,~2.13 μm)和红波段(~0.66 μm)的反射率具有强相关性。除了EVI、NDVI、NMDI、NDSI和VZA外,其余变量与发射率呈负相关。随后,利用GBRT模型生成的特征重要性指标,对变量进行排序和评分(根据排名赋分并求和)。重要性分析表明,对LSE反演最关键的变量包括:SWIR3通道反射率、观测天顶角(VZA)、EVI、红波段反射率、蓝波段反射率、NDWI和NDBI。通过依次添加重要性降序排列的变量并观察模型精度变化,研究发现当使用前7个关键变量时,模型精度已趋于稳定,RMSE显著降低。因此,这七个变量被确定为LSE估算的核心变量集,它们比现有方法(如仅用红波段和NDVI)能更全面地表征地表信息。
第三步:基于核心变量的区域LSE反演模型训练与评估。 为验证方法的普适性,研究为全球11个研究区域分别建立了独立的GBRT反演模型。对于每个区域,使用其及周边3x3个MODIS网格的数据,确保每个区域的训练样本超过110万个,测试样本超过50万个。对每个区域的数据分别进行预处理,并基于总数据集调优得到的参数范围进行进一步的超参数微调,从而得到针对每个区域三个热红外通道的定制化模型。以H25V05区域为例,测试集的散点密度图显示,估算值与MOD21A1D参考值紧密分布在1:1线附近,偏差呈正态分布。对于8.6 μm通道,偏差为-6.18e-6,RMSE为0.021;对于11.0 μm和12.0 μm通道,RMSE分别为0.008和0.006,表现出极高的精度。
第四步:反演结果的综合验证。 验证工作从三个层面展开: 1. 与MODIS产品交叉验证: 将基于500米分辨率MOD09GA反射率数据反演得到的LSE,聚合至1公里后,与同分辨率的MOD21A1D产品进行对比。结果显示,在大多数区域,8.6 μm通道LSE的RMSE约为0.02,而11.0 μm和12.0 μm通道的RMSE大多低于0.01。空间分布图显示,基于GBRT的方法结果与MOD21A1D的空间格局高度一致,且优于传统的NDVI阈值法结果(尤其在8.6 μm通道)。此外,将2019年训练的模型直接应用于2017年的数据,取得了与2019年相近的精度,证明了该方法具有良好的时间可移植性。 2. 与实地测量数据直接验证: 研究收集了六个沙地区域(中国包头、柳园、塔克拉玛干、敦煌,以及美国阿尔戈多内斯、非洲纳米布)的实地测量LSE光谱数据,并将其卷积至MODIS通道以进行比较。结果显示,对于8.6 μm通道,大部分站点的估算值与实测值差异小于0.03;对于11.0 μm和12.0 μm通道,所有站点的RMSE均小于0.01,精度非常高。虽然个别站点(如包头)在8.6 μm通道存在较大差异,分析认为可能与地表覆盖非纯沙地或混合像元有关。总体而言,GBRT方法在裸土/沙地区的反演结果可靠,且精度优于NDVI阈值法。 3. 方法可移植性验证(应用于Landsat 8): 为验证方法对其它传感器的适用性,研究将其应用于仅有两个热红外通道的Landsat 8卫星。首先,基于ASTER光谱库数据,建立了Landsat 8 OLI反射率波段与本研究所用MODIS对应波段之间的线性转换关系(转换RMSE普遍低于0.004)。然后,将转换得到的核心变量输入训练好的GBRT模型,估算出MODIS通道的LSE,再通过另一个线性关系转换为Landsat 8 TIRS通道10和11的LSE。与六个沙地区域的实地测量值对比,估算的Landsat 8 LSE与实测值非常接近,证明了该方法在生成高空间分辨率但热红外通道有限的卫星(如Landsat 8)的LSE产品方面具有巨大潜力。
第五步:敏感性分析。 为评估核心变量输入误差对LSE估算的影响,研究在H25V05区域的数据上,对除VZA外的核心变量添加了5%、10%和15%的高斯噪声。结果表明,对于8.6 μm通道,SWIR3和红波段反射率的敏感性最高,添加15%噪声会使RMSE增加约0.008;对于11.0 μm和12.0 μm通道,所有变量对噪声的敏感性都较低,RMSE变化很小(如12.0 μm通道RMSE变化在0.0004以内)。这说明模型对输入数据误差具有一定的鲁棒性。
四、 主要研究结果
本研究取得了一系列系统且相互支撑的结果: 1. 明确了LSE反演的关键变量: 通过重要性分析,首次系统性地确定了利用VNIR-SWIR数据反演LSE的七个核心变量:SWIR3(~2.13 μm)、红(~0.66 μm)、蓝(~0.47 μm)波段反射率,以及EVI、NDWI、NDBI和观测天顶角(VZA)。这一发现超越了传统NDVI阈值法仅依赖红波段和NDVI的局限,为构建更精确的LSE反演模型提供了关键输入参数依据。 2. 建立了高精度、普适的LSE机器学习反演模型: 基于GBRT算法和核心变量,为全球11个不同气候和地表类型区域成功构建了LSE反演模型。模型在独立测试集上表现优异:对于8.6 μm通道,RMSE在植被或农田为主的区域低于0.02,在裸土岩石较多的区域为0.02-0.03;对于11.0 μm和12.0 μm通道,所有区域的RMSE均低于0.01。这证实了该方法在不同空间区域的强稳健性和普适性。 3. 验证了反演结果的高精度与高分辨率优势: 与MOD21A1D官方产品的交叉验证表明,该方法能获得与之精度相当(8.6 μm通道RMSE约0.02,11/12 μm通道RMSE大多<0.01)且空间细节更丰富(可利用500米分辨率反射率数据生成500米分辨率LSE产品)的结果。与实地测量数据的对比进一步证实了其在沙地区域的可靠性。 4. 证明了方法的时空可移植性: 时间上,利用2019年数据训练的模型在2017年数据上应用仍能保持高精度,显示了良好的时间可移植性。传感器上,通过建立波段转换关系,成功将方法应用于Landsat 8,生成的两个热红外通道LSE与实测值吻合良好,证明了其向其他卫星传感器的空间可移植性,为缺乏多热红外通道的卫星生成LSE产品提供了可行方案。
这些结果层层递进:关键变量的确定为模型构建奠定了基础;区域模型的成功验证了方法的有效性和普适性;与产品和实测数据的对比验证了其精度可靠性;而时空和传感器的可移植性验证则极大地拓展了该方法的实用价值和应用前景。
五、 研究结论与价值
本研究提出并验证了一种基于梯度提升回归树(GBRT)机器学习算法、利用可见光至短波红外(VNIR-SWIR)数据反演地表比辐射率(LSE)的实用且可移植的新方法。研究结论表明: 1. 方法有效性: 该方法能够准确估算中心波长约8.6 μm、11.0 μm和12.0 μm的热红外通道LSE,其精度在与MODIS产品对比和实地验证中均得到证实。 2. 核心贡献: 明确了反演LSE的关键VNIR-SWIR参数集,并利用机器学习揭示了这些参数与LSE之间的复杂非线性关系。相较于现有方法,本方法能更全面地考虑地表类型、物候变化和观测角度对LSE的影响。 3. 应用价值: 该方法具有显著的普适性、稳健性和可移植性。它不依赖于多个热红外通道,降低了数据需求;能够生成空间分辨率高于原始热红外数据的LSE产品;并且可以经过波段转换后应用于Landsat 8等热红外通道有限的传感器,为新型卫星传感器的LSE及地表温度产品开发提供了重要参考。
六、 研究亮点
七、 其他有价值的内容
本研究还指出了当前工作的局限性和未来方向:1)样本集基于现有像元级产品构建,反演精度受这些产品自身精度限制;未来随着实地测量数据更丰富、产品精度提升,该方法可进一步优化。2)尽管实验证明了利用VNIR-SWIR数据反演LSE的可行性,但其背后的物理机制仍需进一步探究。未来值得深入研究LSE与VNIR-SWIR通道数据之间关系的物理表达,以增强方法的理论基础和解释性。