本研究由苗静、甄嘉宁、王俊杰等人合作完成。王俊杰(通讯作者)来自深圳大学大湾区地理环境监测教育部重点实验室、广东省城市信息学重点实验室、深圳市空间信息智能感知与服务重点实验室以及生命与海洋科学学院。研究团队的其他成员分别来自深圳大学建筑与城市规划学院、广东省人工智能与数字经济实验室(深圳)、广东省林业科学研究院广东省森林培育、保护与利用重点实验室。该研究成果以题为“利用哨兵-2影像与XGBoost方法绘制红树林叶片养分季节性分布图”的论文形式,发表于学术期刊《Remote Sensing》(ISSN 2072-4292)。该论文于2022年6月30日收稿,7月28日接受,并于2022年8月1日正式在线发表。
学术背景 本研究隶属于生态遥感与定量遥感的交叉领域,聚焦于红树林这一独特的海岸带生态系统。红树林是全球生物多样性最丰富、生产力最高的海洋生态系统之一,也是蓝碳(Blue Carbon)的主要贡献者,在碳封存方面发挥着至关重要的作用。叶片养分(碳、氮、磷)是理解植物生长、代谢和生态系统功能的关键指标。碳是叶片干物质中最丰富的元素;氮和磷则是构成核酸和蛋白质的必需营养元素,其含量反映了植物的营养状况和利用策略。叶片养分的季节性动态变化与植物的生长过程、气候周期适应以及碳封存动态密切相关,监测这些变化有助于诊断氮、磷养分的可利用性与限制性,从而深入理解红树林生态系统的生长状态和养分利用策略。
在过去的二十年中,航空和卫星遥感技术已成为动态监测红树林生长与健康状况的关键手段。然而,现有研究多集中于红树林范围、物种组成、生物量、叶面积指数和叶绿素含量等的反演与制图。尽管基于可见光-近红外波段的光谱机理表明,植被光谱特征与其叶片化学成分(如C-H和N-H键)有关,使得利用遥感手段估算叶片养分(C、N、P)在农作物和草地生态系统中已有广泛应用,但在红树林生态系统中相关研究却鲜有报道。
在遥感数据源方面,虽然高光谱数据因其丰富的光谱细节被广泛用于叶片养分的估算,并指出红边波段对叶片氮、磷估算敏感,但星载高光谱影像相对稀少。在常用的多光谱卫星中,只有哨兵-2号卫星搭载了三个对植物生长和健康敏感的红边波段,这为红树林叶片养分的长期监测提供了巨大潜力。然而,利用哨兵-2影像进行红树林季节性叶片养分长期制图的研究尚未得到足够重视。
在估算模型方面,由于叶片C、N、P并非物理模型的直接输入参数,其估算主要依赖于经验模型,包括单植被指数回归、多元线性回归以及机器学习模型。近年来,梯度提升算法(如XGBoost和LightGBM)因其良好的精度和较快的计算速度,在生态环境参数(如生物量、土壤有机碳、叶绿素含量)遥感评估中取得了成功,但其在红树林叶片养分估算中的性能尚未得到评估。
因此,基于中国高桥红树林保护区的季节性哨兵-2影像,本研究旨在:1. 探索红树林叶片养分(C、N、P)的季节性响应;2. 比较三种机器学习模型在估算叶片养分方面的性能;3. 将最优模型扩展到2017年至2021年共15个季节的叶片养分制图。研究成果将促进我们对红树林生态系统中季节性养分循环和限制性的理解。
详细工作流程 本研究包含五个主要流程:野外采样与化学分析、遥感数据预处理与特征提取、机器学习模型构建与比较、模型性能评估、以及叶片养分时空制图与分析。
第一流程:野外采样与化学分析。 研究选择广东湛江高桥红树林保护区作为研究区。分别在2018年春季(5月22-26日)、2019年冬季(12月20-28日)和2020年夏季(8月6-12日)进行了三次野外调查。研究区内主要红树林物种包括桐花树、木榄、白骨壤、红海榄、无瓣海桑和秋茄。采用随机采样策略,在三个季节分别设置了53个、62个和57个样方(15m × 15m),每个样方内为单一物种。在每个样方中,随机选择5棵树木,从每棵树的顶层冠层随机采集5片成熟健康叶片。使用差分GPS记录样方中心点的地理位置,定位精度小于20厘米,以确保与几何校正后的哨兵-2影像像素(10m × 10m)精确匹配。
采集的鲜叶样本在65°C烘箱中干燥72小时。之后,分别采用高温外热重铬酸钾氧化-容量法测定碳浓度、凯氏定氮法(包括消化、蒸馏和滴定)测定氮浓度、钒钼黄比色法(硫酸-过氧化氢消化)测定磷浓度,单位均为g/kg。
第二流程:哨兵-2影像预处理与特征提取。 从美国地质调查局官网下载了与采样日期尽可能一致的三景无云哨兵-2影像(Level-1C产品,获取日期:2018年5月23日、2019年11月24日、2020年8月23日)。使用哨兵应用平台中的Sen2Cor模块进行大气校正,将表观反射率转换为冠层反射率。随后,利用SNAP软件中的Sen2Res插件,将空间分辨率为20米和60米的波段(B5, B6, B7, B8, B11, B12)重采样至10米,该算法利用几何信息对低分辨率像元进行解混,在保持光谱特征不变的同时实现超分辨率重建。
基于12个10米空间分辨率的波段,为每景影像提取了总计30个植被指数。由于叶片氮、磷与叶绿素等色素关系密切,且红边波段对氮、磷敏感,所选植被指数中有28个与叶绿素、类胡萝卜素、花青素及红边波段相关,另外还包括2个与红树林相关的指数。计算了红树林叶片C、N、P浓度与哨兵-2影像光谱特征(12个波段+30个植被指数)之间的皮尔逊相关性。最后,利用无人机生成的正射影像(空间分辨率0.2米)对影像进行几何精校正。
第三流程:机器学习模型构建与比较。 研究采用了三种集成学习算法:极端梯度提升、随机森林和轻量梯度提升机。 1. XGBoost:基于梯度提升决策树改进,在代价函数中引入二阶泰勒展开以防止过拟合,并采用稀疏感知分割查找方法处理稀疏数据,适用于野外样本数量有限的定量遥感研究。 2. 随机森林:基于Bagging方法,一次建立多个相互独立的决策树(弱评估器),并通过投票机制得出最终预测结果。 3. LightGBM:同样基于GBDT,但采用带有深度限制的按叶子生长策略,并使用梯度单边采样和互斥特征捆绑技术以加速训练。
所有模型均使用Python构建。为比较模型性能,研究采用了两种建模策略: * 策略一(单季节数据集建模):针对每个季节的数据集分别建立模型,共构建9个回归模型(3种方法 × 3个季节)。基于每种机器学习方法得出的特征重要性得分,选择得分大于所有得分标准差的特征作为敏感特征用于建模。 * 策略二(混合季节数据集建模):将三个季节的所有样本合并,建立3个综合模型,并用该模型预测每个季节的样本。
第四流程:模型性能评估。 采用留一法交叉验证评估模型性能。评估指标包括决定系数、相对均方根误差和残差预测偏差。R²越高,rRMSE和MAE越低,RPD越高,表明模型性能越好。根据最优模型(XGBoost)的估算结果,将所有样本按养分浓度的四分位值分为四组,并计算每组的样本数量和平均绝对误差。
第五流程:叶片养分时空制图与分析。 针对每种养分,选择最优的机器学习模型(XGBoost单季节模型)绘制其三个季节的空间分布图。为了解养分空间聚集模式,在ArcGIS 10.8中使用Getis-Ord Gi*统计进行热点分析,识别具有统计显著性的高值簇和低值簇。
为理解不同年份间红树林叶片养分的季节变化,研究另外获取了2017年至2021年期间的12景无云哨兵-2影像,并基于相应的最优模型绘制了共15个季节的叶片C、N、P浓度分布图。
主要研究结果 1. 红树林叶片养分的季节性变化:野外测量结果表明,叶片C浓度在夏季最高,春季和冬季较低且无显著差异;叶片N和P浓度则在冬季显著高于春季和夏季(春季与夏季间无显著差异)。相关性分析显示,叶片N与P呈极显著正相关,而C与N、C与P呈极显著负相关,且N-P相关性强于C-N和C-P相关性。研究区红树林叶片平均C浓度高于全球陆地木本植物和沿海湿地植物的平均值,而平均N和P浓度则较低,表明该红树林生态系统具有较强的碳固存能力。较低的N/P比值表明该区域红树林生长可能受氮限制。
叶片养分与光谱特征的相关性:叶片养分与哨兵-2影像光谱特征的相关系数存在季节差异。总体而言,冬季三个养分与光谱特征的平均绝对相关系数最强。对三个养分最敏感的波段主要集中在红边波段(B5, B6, B7)和近红外波段(B8, B8A),其中B6波段在不同季节均表现出较高的相关性。最敏感的植被指数多由这些波段构建,如用于估算C和N的MCARI/OSAVI,以及由B3、B4、B5和B8构建的简单比值指数等。
机器学习模型性能比较:
叶片养分空间制图结果:
研究结论 本研究系统评估了利用哨兵-2影像和机器学习方法估算红树林季节性叶片养分的潜力,并成功绘制了长时间序列的养分分布图。主要结论如下: 1. XGBoost方法结合哨兵-2影像的光谱特征,能够较为准确地估算红树林叶片C、N、P浓度,是进行此项研究的有效工具。 2. 在三种养分中,叶片C浓度的估算精度最高,其次是N和P。 3. 哨兵-2影像的红边波段(尤其是B6)和近红外波段是估算红树林叶片养分的高效因子。 4. 红树林叶片养分存在显著的季节差异,C在夏季最高,N和P在冬季最高,且N与P高度协同变化。 5. 长时间序列的季节性监测有助于理解红树林碳固定、养分利用和生长状态的动态变化。
研究的价值与意义 本研究的科学价值在于,首次系统地将XGBoost机器学习算法与哨兵-2影像的红边波段相结合,应用于红树林这一复杂海岸带生态系统的叶片养分季节性动态监测与制图,填补了该领域的研究空白。研究不仅揭示了研究区红树林叶片养分的季节变化规律和空间分布模式,还验证了利用免费的中分辨率多光谱卫星数据进行生态系统生化参数长期监测的可行性。
其应用价值在于,所建立的方法框架可为红树林生态系统的健康诊断、养分限制性评估、以及蓝碳固存能力的动态监测提供重要的技术手段和数据支持。研究结果对于红树林保护区的精细化管理和生态修复实践具有指导意义。
研究亮点 1. 研究对象与问题的创新性:聚焦于红树林叶片养分(C、N、P)的遥感估算与季节性制图这一尚未被充分探索的课题。 2. 方法组合的先进性:率先将性能优异的XGBoost机器学习算法与具有红边波段的哨兵-2影像相结合,用于红树林生化参数反演,并系统比较了多种主流机器学习算法的性能。 3. 研究的系统性与时序性:不仅分析了三个典型季节的养分变化,还将模型扩展至连续五年共15个季节的制图,实现了从静态分析到动态监测的跨越。 4. 对光谱机制的深入挖掘:明确了红边波段和近红外波段在红树林养分估算中的关键作用,并识别出最敏感的植被指数类型,为类似研究提供了特征选择参考。
其他有价值的内容 研究也坦诚指出了其局限性:春季的样本空间覆盖范围和养分数据范围相对较窄,影响了模型在该季节的性能和泛化能力;哨兵-2影像10米像素的混合像元问题以及近岸区域受海水、泥沙的影响可能带来估算误差;长时间序列制图缺乏其他年份的实地验证数据。针对这些不足,作者展望了未来工作方向,提出将物种信息、高程、叶面积指数和冠层高度等辅助信息融入模型,以提高模型的精度、稳健性和普适性。这为后续研究提供了清晰的改进思路。