本研究由杨硕、黄义文、周大云、黄龙雨、吴玉珍、付守阳、徐青、彭军、匡猛等研究人员共同完成,主要来自中国农业科学院棉花研究所、棉花生物育种与综合利用全国重点实验室、郑州大学农学院以及三亚中国农业科学院国家南繁研究院。研究成果发表于2024年3月的《中国粮油学报》(Journal of the Chinese Cereals and Oils Association)第39卷第3期。
作为全球最大产棉国,我国棉花产业长期以纤维利用为主,而棉籽等副产物的综合利用率不足。棉籽富含30%-70%的蛋白质,且氨基酸组成优良,具有抗氧化、增强免疫力等功能,是重要的非粮蛋白来源。然而,传统蛋白质检测方法(如凯氏定氮法)存在破坏样本、操作繁琐、污染环境等问题,难以满足现代育种和产业需求。近红外光谱(Near Infrared Spectroscopy, NIRS)技术因其无损、快速、环保等优势,已在其他作物中广泛应用,但针对棉籽的研究多集中于光籽或种仁,缺乏对毛籽的快速检测方法。因此,本研究旨在建立适用于毛籽、光籽和棉仁三种形态的棉籽蛋白质含量NIRS检测模型,为棉籽资源利用和品质育种提供技术支撑。
研究选取187份来自黄河流域、长江流域、西北内陆棉区及国外的棉花品种,于2020年在中国农业科学院棉花研究所东场实验站种植。成熟后采集棉铃,经轧花、浓硫酸脱绒和手工剥壳分别获得毛籽、光籽和棉仁样品,烘干至恒重备用。其中158份作为定标集建模,29份作为验证集。
采用凯氏定氮法(Kjeldahl method)测定棉仁蛋白质含量,参照国家标准GB 5009.5-2016。每个样品重复3次,相对误差控制在2%以内,取平均值作为化学参考值。
使用XD型近红外分析仪采集样品光谱,波长范围400-2500 nm。样品经25℃、60%湿度平衡后,以直径35 mm的样品杯压实扫描,每次重复3次,记录反射强度(R)并转化为log(1/R)的原始光谱数据。
通过WinISI III软件进行以下关键步骤:
- 异常值剔除:基于马氏距离(Mahalanobis distance)筛选代表性样品,确保光谱差异最大化。
- 光谱预处理:对比7种散射处理(如SNV、Detrend等)和16种数学处理(如一阶导数、平滑等),优化模型性能。
- 模型构建:采用改良偏最小二乘法(Modified Partial Least Squares, MPLS)建立三种棉籽形态的蛋白质预测模型,以定标相关系数(RSQ)、交叉验证误差(SECV)等指标评估模型质量。
通过验证集的化学值与预测值比较,计算相关系数(R²)和预测标准误差(SEP),并进行t检验分析差异显著性。
本研究首次建立了覆盖毛籽、光籽和棉仁的棉籽蛋白质NIRS检测体系,模型精度高(RSQ均>0.95),解决了传统方法破坏样本、效率低下的问题。其科学价值在于:
1. 方法学创新:通过多形态光谱特征优化,拓展了NIRS在棉籽检测中的应用场景。
2. 育种应用:为高蛋白棉籽品种筛选提供高效工具,加速遗传改良进程。
3. 产业意义:推动棉籽蛋白资源的高值化利用,缓解我国对进口豆粕的依赖,保障粮食安全。
研究筛选的高蛋白材料(如新陆早28、ARl971等)为后续功能基因挖掘提供了基础。此外,光谱分析表明蛋白质主要富集于棉仁,棉短绒和籽壳会干扰光散射,这一发现为样品前处理优化提供了理论依据。