分享自:

基于太赫兹光谱和化学计量学方法的玉米品种鉴别

期刊:Spectrochimica Acta Part A: Molecular and Biomolecular SpectroscopyDOI:10.1016/j.saa.2021.119475

类型a:

基于太赫兹光谱结合化学计量学方法的玉米品种鉴别研究

一、研究团队与发表信息
本研究由Si Yang、Chenxi Li(通讯作者)、Yang Mei等合作完成,作者单位包括天津大学精密测试技术及仪器国家重点实验室(State Key Laboratory of Precision Measuring Technology and Instruments, Tianjin University)、湘潭大学化工学院(School of Chemical Engineering, Xiangtan University)及中国农业大学食品科学与营养工程学院(College of Food Science and Nutritional Engineering, China Agricultural University)。研究成果发表于Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy期刊2021年第252卷,文章标题为《Discrimination of corn variety using terahertz spectroscopy combined with chemometrics methods》。

二、研究背景与目标
玉米是全球重要的经济作物,而高油玉米(High-Oil Corn, HOC)因其含油量(约6%)是普通玉米(Normal Corn, NC)的两倍,且富含优质蛋白质,在食品、饲料及生物燃料领域具有重要价值。传统玉米品种鉴别方法(如形态学分析、化学检测或基因测序)存在耗时长、成本高或需有害溶剂等问题。近红外光谱(NIR)和核磁共振(NMR)等技术虽有一定应用,但依赖化学成分且设备昂贵。

太赫兹光谱(Terahertz Spectroscopy, THz)通过检测0.1–10 THz频段内分子振动、旋转及氢键等相互作用,可获取生物分子的特征吸收指纹。然而,HOC与NC的化学成分差异微小,此前太赫兹技术尚未用于玉米品种鉴别。本研究旨在开发一种结合太赫兹时域波形(THz-TDW)和吸收光谱(THz-AS)的信号分类方法,建立高效、无损的玉米品种鉴别模型。

三、研究方法与流程
1. 样本制备与数据采集
- 样本来源:360粒HOC(品种High-Oil 5598)和210粒NC(品种Zhengdan 958),均来自中国农业大学玉米改良中心,经核磁共振(NMR)筛选含油量(HOC: 6–10%;NC: 3–6%)。
- 样本处理:玉米粒研磨成粉后压制成厚度均匀的片状样品(0.2 g,压力15吨,压制15分钟),以减少多重散射干扰。
- 太赫兹光谱测量:使用日本Advantest公司的TAS7500SU时域光谱系统,频率范围0.5–3.5 THz(393个变量,分辨率7.6 GHz),每个样本测量3次以提高信噪比。

  1. 信号处理与特征提取

    • THz-TDW分析:通过快速傅里叶变换(FFT)将时域波形转换为频域光谱,并提取折射率(n(ω))和吸收系数(α(ω))。采用主成分分析(PCA)降维,前三个主成分(PC1–PC3)累计贡献率达99.64%,用于后续分类。
    • THz-AS分析:采用三种变量选择方法:
      • 无信息变量消除(UVE):基于偏最小二乘回归系数稳定性分析,筛选254个变量(64.6%原始变量)。
      • UVE-连续投影算法(UVE-SPA):进一步减少冗余变量,最终保留33个特征变量。
      • 竞争性自适应重加权采样(CARS):通过蒙特卡洛采样和PLS回归,选择64个关键变量。
  2. 分类模型构建

    • 分类器选择:比较线性判别分析(LDA)和支持向量机(SVM),后者采用线性核(LF)和径向基核(RBF)。
    • 模型验证:采用自助拉丁分区法(BLP,10次自助采样和5次拉丁分区)评估模型性能,计算灵敏度(Sens)、特异性(Spec)和准确率(Acc)。

四、主要研究结果
1. THz-TDW模型的鉴别效果
- PCA-SVM(RBF核)模型表现最佳,预测集准确率达94.7%,灵敏度(99.5%)和特异性(88.3%)均高于LDA模型(准确率77.2%)。
- 时域波形结合非线性分类器(SVM)更适合处理HOC与NC的微小差异。

  1. THz-AS模型的鉴别效果

    • 变量选择的重要性:CARS-SVM(RBF核)模型在预测集实现100%准确率,显著优于全波段模型(80.7%)。
    • 关键频段:1.5–2.5 THz是鉴别HOC与NC的最重要频段,与氨基酸(如谷氨酸1.21 THz、丝氨酸2.01 THz)和脂肪酸(如油酸2.21 THz)的特征吸收峰相关。
  2. 方法对比

    • 变量选择方法中,CARS因结合自适应加权采样,能高效剔除无关变量;UVE-SPA虽变量最少(33个),但可能过度修剪。

五、研究结论与价值
本研究首次将太赫兹光谱技术应用于玉米品种鉴别,提出基于THz-TDW和THz-AS的联合分析策略,并通过PCA和变量选择方法优化模型性能。CARS-SVM模型在预测集实现100%准确率,为农业品种鉴别提供了高效、无损的新方法。科学价值在于拓展了太赫兹光谱在农业检测中的应用边界;应用价值体现在可推广至其他作物(如转基因或单倍体种子)的快速筛查。

六、研究亮点
1. 方法创新:首次结合THz-TDW(时域特征)与THz-AS(频域特征),弥补单一信号分析的局限性。
2. 算法优化:对比多种变量选择方法,明确CARS在太赫兹光谱分析中的优势。
3. 高精度模型:CARS-SVM模型达到100%鉴别准确率,为同类研究提供标杆。

七、其他发现
研究还发现,HOC的THz吸收系数普遍低于NC,这与NC中淀粉含量更高(极性分子吸收更强)的化学特性一致,间接验证了模型的生物学合理性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com