这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由Zhou Yao(华中农业大学)、Mengting Yao(华中农业大学)、Chuang Wang(华中农业大学)等8位作者共同完成,通讯作者为Jianxiao Liu(liujianxiao@mail.hzau.edu.cn)。研究团队来自华中农业大学的作物遗传改良全国重点实验室、农业生物信息学湖北省重点实验室及信息学院。论文于2025年1月25日被Molecular Plant期刊接收(DOI: https://doi.org/10.1016/j.molp.2025.01.020),标题为《GEFormer: A genomic prediction method of genotype-environment interaction in maize by integrating gating mechanism MLP and linear attention mechanism》。
科学领域:本研究属于作物基因组预测(Genomic Prediction, GP)与基因型-环境互作(Genotype-Environment Interaction, G×E)的交叉领域。
研究动机:
1. 现实需求:全球气候变化对粮食安全构成挑战,作物需适应动态环境。传统基因组预测方法未充分考虑环境因素,导致预测精度不足。
2. 技术瓶颈:现有方法(如基于环境协变量EC或高斯核的模型)无法捕捉环境因子的高阶非线性互作及时间动态特征。
3. 深度学习潜力:计算机视觉和自然语言处理中的多模态特征融合技术为G×E建模提供了新思路。
研究目标:开发一种整合门控机制MLP(Gated MLP)和线性注意力机制(Linear Attention Mechanism)的深度学习模型(GEFormer),提升玉米、水稻和小麦等重要农艺性状的多环境预测精度。
模型包含5层(图1):
- 输入层:标准化基因型和环境数据。
- GMLP层:通过门控机制MLP提取SNP的局部和全局特征(g*),捕获长程依赖关系。
- TimeFeatureBlock层:
- Omni-dimensional动态卷积(ODConv):动态调整卷积核参数,提取每日内多环境因子的综合效应。
- 线性注意力机制:捕捉环境因子的时间序列特征(如温度逐日变化)。
- CrossGatedMLP层:通过门控信号融合g*、环境特征e*及互作特征g*×e*。
- 输出层:MLP映射融合特征至表型值(如株高、穗重)。
验证三种场景:
- M1:测试环境中未测试基因型(十折交叉验证)。
- M2:未测试环境中测试基因型(留一环境交叉验证)。
- M3:未测试环境与未测试基因型(最严苛场景)。
对比方法:
- 统计学习方法:如EA+GW(GB)、EA+GW(GK)等6种。
- 机器学习方法:随机森林(RF)、XGBoost、Stacking和深度学习(DL)。
通过显著性分析(Saliency Map),GEFormer识别出影响玉米产量的关键环境因子(如温度、水分),与作物生长模型CERIS的结果一致性达53.85%(图S37)。
(全文约2000字)