类型a:
本研究由Chloe Siegel、Meriem Aoun、Gary L. Windham、W. Paul Williams和Rebecca J. Nelson共同完成,分别来自康奈尔大学和密西西比州立大学。该研究于2023年7月10日发表在《Food Control》期刊上,文章标题为《A balancing act: Synthetic oversampling corrects skewed distribution of aflatoxin in maize and improves prediction of contaminated kernels》。
黄曲霉毒素(aflatoxin, AF)是由真菌Aspergillus flavus产生的一种强致癌代谢物,广泛存在于玉米等农作物中,严重威胁人类和牲畜的健康,并造成巨大的经济损失。传统的黄曲霉毒素检测方法依赖于可见的霉菌生长或紫外线荧光,但这些方法存在一定的局限性,尤其是无法检测到内部霉菌生长的玉米粒。光谱技术通过分析玉米粒在紫外、可见和近红外光谱范围内的吸收和反射模式,提供了一种更准确的检测手段。然而,现有光谱模型的敏感性受到黄曲霉毒素污染样本数量不足的限制,尤其是高污染样本的稀缺性。因此,本研究旨在通过人工富集高污染样本(≥150 ppb)来改进光谱模型的预测能力,并探索黄曲霉毒素污染的关键光谱特征。
研究分为以下几个主要步骤:
生物材料准备
研究选取了10个不同黄曲霉毒素积累表型的玉米杂交品种,包括4个高敏感、3个中等敏感和3个中等抗性的品种。这些玉米在密西西比州种植,并通过侧针技术接种Aspergillus flavus菌株NRRL 33574.26。收获后,共收集了872个玉米粒,分为高敏感(447个)、中等敏感(210个)和中等抗性(215个)三组。
湿润培养处理
为了模拟不良储存条件,研究对部分玉米粒进行了湿润培养处理。玉米粒在30°C的湿润培养箱中培养3天或6天,以增加黄曲霉毒素的积累。培养后的玉米粒通过酶联免疫吸附测定(ELISA)定量其黄曲霉毒素浓度。
光谱数据采集
使用紫外-可见-近红外光谱仪对玉米粒进行光谱测量,获取其在304-1085 nm范围内的反射光谱数据。每个玉米粒的光谱数据包含1563个波长点的反射率值。
光谱数据预处理
为了减少杂散光和光散射的影响,研究对光谱数据进行了预处理,包括去除前50和后50个波长点的数据,并对剩余波长点进行标准正态变量(SNV)变换。
合成过采样
为了平衡数据集中的样本分布,研究采用了自适应合成过采样技术(ADASYN)生成合成样本。ADASYN算法通过随机生成现有样本与其最近邻样本之间的光谱数据,增加了高污染样本的数量。
分类模型构建
研究构建了四种分类模型:偏最小二乘法(PLS)、随机森林(RF)、岭回归(Ridge)和Lasso回归。模型基于不同训练集(包括或不包括湿润培养样本和合成样本)进行训练,并评估其在高污染样本(≥150 ppb)上的分类敏感性和特异性。
主成分分析和特征重要性分析
通过主成分分析(PCA)评估合成样本和湿润培养样本的光谱特征是否引入干扰。此外,研究还分析了各模型在不同波长范围的特征重要性,以确定黄曲霉毒素污染的关键光谱区域。
湿润培养和合成过采样的效果
湿润培养处理增加了5-75 ppb范围内的黄曲霉毒素浓度样本,但并未显著增加高污染样本(≥150 ppb)的数量。合成过采样技术显著提高了高污染样本的比例,并改善了模型在高污染样本上的分类敏感性。在未使用合成样本的模型中,分类特异性(92%-98%)远高于敏感性(29%-51%);而在使用合成样本的模型中,敏感性和特异性均显著提高,部分模型达到了76%-80%的平衡表现。
关键光谱区域
研究确定了五个在多个模型中具有高特征重要性的光谱区域:329-345 nm、380-385.5 nm(紫外范围)、415-425 nm、639-668 nm(可见范围)和1013.5-1060 nm(近红外范围)。这些区域可能与黄曲霉毒素及其相关代谢物(如kojic acid)的光谱特征有关,也可能与玉米粒的物理特性(如硬度)和化学成分(如类胡萝卜素)相关。
本研究通过合成过采样技术有效平衡了光谱模型训练集中高污染样本的分布,显著提高了模型对黄曲霉毒素污染的预测能力。湿润培养处理虽然增加了中低污染样本的数量,但对高污染样本的贡献有限。研究还确定了多个关键光谱区域,为开发低成本、窄波长光谱检测设备提供了理论依据。这些发现对黄曲霉毒素检测技术的改进和在低资源地区的应用具有重要意义。
研究还指出,模型的分类敏感性和特异性并不直接等同于实际毒素减少效果,未来研究应结合模拟模型来评估不同污染分布下的毒素减少效果。此外,研究强调了在低资源地区推广低成本光谱检测技术的重要性,以应对黄曲霉毒素污染对食品安全和公共健康的威胁。