分享自:

利用RGB航空影像和机器学习改进田间豌豆成熟期估计

期刊:The Plant Phenome JournalDOI:10.1002/ppj2.70038

学术研究报告:基于RGB航空影像与机器学习的田间豌豆成熟期估算方法改进

一、研究团队与发表信息
本研究由Harry Navasca(北达科他州立大学植物科学系)领衔,联合Aliasghar Bazrafkan、Françoise Dalprá Dariva等15位来自美国多所高校及USDA-ARS的研究人员共同完成,成果发表于*The Plant Phenome Journal*(2025年7月15日接收,DOI: 10.1002/ppj2.70038)。

二、学术背景与研究目标
科学领域:本研究属于作物育种与表型组学(phenomics)交叉领域,聚焦于豌豆(*Pisum sativum L.*)成熟期(days to maturity, DTM)的高通量表型分析技术。
研究背景:传统DTM人工评分法存在效率低、主观性强等问题,难以适应大规模多环境试验。无人机(uncrewed aerial systems, UAS)搭载RGB传感器为低成本、高通量表型分析提供了可能,但其在豌豆成熟期遗传解析中的应用尚未系统探索。
研究目标
1. 对比航空影像与人工评分的DTM估算精度;
2. 确定最佳影像采集时间点;
3. 通过全基因组关联分析(genome-wide association study, GWAS)鉴定与DTM相关的遗传位点。

三、研究流程与方法
1. 实验设计与数据采集
- 研究对象:300份遗传多样性豌豆种质资源,采用增强不完全区组设计,共700个小区(每小区4 m²),种植于美国北达科他州Prosper试验站。
- 表型数据
- 人工评分:从开花期(R7阶段)开始每3天记录叶片和豆荚黄化程度,以90%组织褐化为成熟标准。
- 航空影像:使用Autel Evo II Pro无人机(20 MP RGB传感器)在50米高度拍摄,时间点为46–94天(days after planting, DAP),重点分析71 DAP数据。

2. 影像处理与植被指数计算
- 预处理:通过Pix4Dmapper软件拼接影像,ArcGIS Pro提取20个RGB植被指数(vegetation indices, VIs),包括可见光抗大气干扰指数(visible atmospherically resistant index, VARI)、改良绿红植被指数(modified green-red vegetation index, MGRVI)等。
- 创新方法
- 采用过量绿度指数(excess green index, ExG)二值化分割植被与土壤,阈值设定为0.65;
- 开发基于Zonal Statistics的自动化特征提取流程,获取各小区VI均值、中位数等统计量。

3. 机器学习模型构建
- 模型选择:对比随机森林(random forest, RF)、极端随机树(extra trees)、自适应提升(AdaBoost)和XGBoost四种回归模型。
- 超参数优化:通过网格搜索(grid search)和五折交叉验证确定最优参数(如XGBoost的n_estimators=200, max_depth=5)。
- 特征重要性分析:使用反向特征消除法筛选关键VIs。

4. 遗传分析
- GWAS:基于19,826个SNP标记,采用混合线性模型(mixed linear model, MLM)控制群体结构(前3个主成分)和亲缘关系。
- 候选基因注释:以显著SNP位点±100 kb为窗口,从豌豆参考基因组(*Pisum sativum v1a*)中筛选候选基因。

四、主要研究结果
1. 航空表型提升遗传力与模型精度
- 遗传力:RGB-VIs的平均遗传力(H²=0.91)显著高于人工评分(H²=0.84),表明影像数据更能捕获遗传变异。
- 最佳时间点:71 DAP时模型预测精度最高(XGBoost R²=0.60),此时VARI、MGRVI和红度指数(redness index, RI)贡献度分别为31%、17%和13%。

2. 关键植被指数与成熟期关联
- VARI与MGRVI与DTM呈强正相关(r=0.76),RI呈负相关(r=-0.76),反映绿度衰减与成熟进程的同步性。
- PCA分析显示VARI、MGRVI与人工DTM在降维空间中紧密聚类,验证其生物学一致性。

3. GWAS发现新遗传位点
- 染色体5上188.79 Mb和141.17 Mb的SNP(如s5lg3_188788921)与VARI、MGRVI显著关联(p<3.92×10⁻⁵),这些位点未通过传统DTM检测到。
- 候选基因
- *Psat5g10720*(RNA识别基序蛋白):参与非生物胁迫响应;
- *Psat5g078680*(PI3K激酶):调控细胞分裂与氧化应激。

五、研究结论与价值
科学意义
1. 首次将RGB航空表型与GWAS结合解析豌豆成熟期遗传基础,填补了豆科作物中此类研究的空白;
2. 证实影像衍生性状(如VARI)比传统表型具有更高的遗传力和检测效力,为“缺失遗传力”问题提供新思路。

应用价值
- 为公共育种项目提供低成本、可扩展的成熟期评估方案,加速适应气候变化品种选育;
- 鉴定的SNP标记和候选基因可作为分子育种靶点。

六、研究亮点
1. 方法创新:开发了基于ExG分割和XGBoost回归的自动化分析流程,实现高通量表型提取;
2. 发现新颖性:通过航空表型发现传统方法遗漏的遗传位点,揭示成熟期调控新机制;
3. 技术普适性:方案可推广至其他作物,尤其适合资源有限的育种项目。

七、其他价值
研究数据(SNP数据集PRJNA730349、代码库GitHub/harryska/peadaystomaturity)公开共享,促进方法复现与跨作物比较研究。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com