分享自:

基于太赫兹光谱和卷积神经网络的转基因玉米品种分类

期刊:Journal of Food Composition and AnalysisDOI:10.1016/j.jfca.2025.107771

这篇文档属于类型a,是一篇报道单篇原创研究的学术论文。以下为具体报告内容:


作者与机构
本研究由河南工业大学(Henan University of Technology)的多个团队合作完成,通讯作者为Hongyi Ge(gehongyi2004@163.com)。主要作者包括Yuying Jiang、Xixi Wen、Guangming Li、Hao Chen等,涉及谷物信息处理与控制教育部重点实验室(Key Laboratory of Grain Information Processing and Control)、河南省谷物光电检测与控制重点实验室(Henan Provincial Key Laboratory of Grain Photoelectric Detection and Control)等机构。论文发表于Journal of Food Composition and Analysis期刊,2025年5月正式出版(DOI:10.1016/j.jfca.2025.107771)。


学术背景
研究领域:本研究属于农业检测技术与人工智能交叉领域,聚焦于利用太赫兹时域光谱(Terahertz Time-Domain Spectroscopy, THz-TDS)结合卷积神经网络(Convolutional Neural Network, CNN)对转基因玉米品种进行分类。

研究动机:玉米是中国第一大粮食作物,转基因技术的应用日益广泛,但传统检测方法(如DNA和蛋白质检测)存在破坏样本、耗时长且无法适用于加工后玉米的缺陷。太赫兹波因其高穿透性、低光子能量和分子指纹特征,成为无损检测的潜在工具。然而,当前针对转基因玉米的THz-CNN联合研究较少。

研究目标:开发一种基于THz-TDS和1D-CNN的高精度分类方法,实现对5种转基因玉米品种(MIR162、MON87427、MON87460、MON88017、MON89034)的快速无损鉴别。


研究流程
1. 样本准备
- 研究对象:5种转基因玉米粉末(每种180个样本,共900个样本),均来自商业化的标准材料。
- 预处理:真空干燥(60℃, 1–2小时)以控制水分含量低于5%,压制成直径13 mm、厚度1.1 mm的圆片。

  1. 光谱采集与参数提取

    • 仪器:国产QT-TO1000型THz 3D成像系统,采用透射模式,扫描范围0.1–1.1 THz(181个光谱特征)。
    • 光学参数计算:通过快速傅里叶变换(FFT)从时域信号转换为频域信号,基于Dorney模型提取吸收系数(α)和折射率(n)。
  2. 数据预处理

    • 异常值剔除:采用孤立森林算法(Isolation Forest, IF)检测并移除5个异常样本(4个MON88017,1个MON89034)。
    • 光谱增强:一阶导数(First Derivative, FD)处理消除基线漂移,提高分辨率。
    • 特征提取:主成分分析(PCA)降维,前10个主成分累计贡献率达97.12%。
  3. 模型构建与优化

    • 传统机器学习模型
      • 支持向量机(SVM)结合网格搜索(GS)、粒子群优化(PSO)和河马优化(HO)算法,优化核函数参数(C和g)。
      • K近邻(KNN)模型,通过网格搜索调整邻居数(k=3,5,7,10)和距离权重(均匀/距离加权)。
    • 深度学习模型
      • 1D-CNN结构:6个卷积层(3×1核,tanh激活函数)+3个池化层(3×1核,最大池化)+全连接层。
      • 训练参数:初始学习率0.002,批次大小32,使用Adam优化器和分类交叉熵损失函数。
  4. 模型评估

    • 指标:准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1值。
    • 数据划分:训练集623样本(70%),测试集272样本(30%)。

主要结果
1. 光谱分析
- 不同转基因品种的吸收系数存在显著差异(如MON88017吸收最强,MIR162最弱),但无明确特征峰(图4a)。FD预处理后,光谱分辨率显著提升(图4b)。

  1. 模型性能

    • 传统模型:FD预处理后,PCA-HO-SVM准确率最高(90.75%),但对MON88017的分类性能下降(83.02%)。优化算法中,HO表现优于PSO和GS(图7)。
    • 深度学习模型:1D-CNN在FD预处理后达到最高准确率96.68%,误分类率仅3.32%(表3)。其对MON88017的识别率从86.79%提升至96.22%(图9)。
  2. 结果逻辑链

    • 光谱差异 → PCA提取特征 → 传统模型(SVM/KNN)依赖人工特征优化 → 性能受限于特征选择 → 1D-CNN自动提取全波段特征 → 更高准确率。

结论与价值
1. 科学价值
- 验证了THz-CNN组合在转基因作物检测中的高效性,1D-CNN的端到端特征学习能力显著优于传统机器学习。
- 提出FD预处理可增强光谱特征,弥补THz光谱因分子复杂性导致的特征模糊问题。

  1. 应用价值
    • 为农业食品安全提供无损、快速的转基因成分筛查方案,尤其适用于加工后样品的检测。
    • 模型可扩展至其他农作物或转基因事件的分类。

研究亮点
1. 方法新颖性
- 首次将河马优化算法(HO)用于THz光谱的SVM参数优化,较传统PSO算法收敛更快(图7b)。
- 设计的1D-CNN模型通过分层卷积直接处理全波段光谱,避免人工特征选择的偏差。

  1. 技术突破

    • 在0.1–1.1 THz波段实现96.68%的分类准确率,为当前转基因玉米THz检测的最高水平。
    • 提出“FD-PCA-CNN”联合流程,平衡计算效率与模型性能。
  2. 局限性

    • 未定量分析转基因成分含量;未针对环境干扰(温湿度)设计鲁棒性补偿机制。

其他价值
- 公开的样本制备与光谱采集流程可为后续研究提供标准化参考。
- 研究得到中国国家自然科学基金(61975053, 62271191)等多项资助,体现其学术认可度。

(报告全文约2000字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com