本研究由来自广西医科大学口腔医学院及附属口腔医院(广西口腔颌面修复与重建重点实验室、实验研究部)、广西医科大学第一附属医院等机构的科研团队完成。主要作者包括Ao Long、Wenjin Chen(并列一作)、Shufang Zhuo、Jun Zhou、Beibei Xie、Hailun Zhou、Yiwu Qin、Kangjing Li、Chunyun Liang、Cong Liu、Lu Liu、Yigeng Liu、Xianxian Huang、Fengyuan Zhou,通讯作者为Xinglu Jiang教授。该研究成果以“AI-Assisted Multiplex SYBR Green I‑Based qPCR for the Identification and Quantitative Analysis of Oral Microbiota”为题,发表于《Analytical Chemistry》期刊,于2026年1月16日正式在线出版。
本研究属于分子诊断技术领域,具体聚焦于多重定量聚合酶链式反应(multiplex qPCR)方法的创新。背景在于,感染性疾病,尤其是口腔龋病等多微生物感染,往往由多种病原体共同作用,其种类和数量与疾病进程和严重程度密切相关。因此,发展一种能够高通量、高精度、定量检测多种病原体的技术对于临床诊断至关重要。传统的多重qPCR技术面临荧光通道有限、探针成本高昂、引物间相互干扰以及熔解曲线分析只能提供终点数据而难以准确定量等挑战。基于此,本研究旨在开发一种新型、低成本、高灵敏度的多重qPCR系统,以实现对多种病原体(以三种致龋菌为例)的实时、定量检测,并探索人工智能(AI)在解析复杂扩增曲线中的应用。其核心目标包括:1)建立并优化一种基于速度控制PCR(Velocity-controlled PCR, vc-PCR)的多重检测系统;2)利用该系统结合SYBR Green I染料,在单一荧光通道内实现对多种目标的同时监测;3)开发人工智能框架,对双联(duplex)和三联(triplex)vc-PCR产生的复杂扩增曲线进行准确判读,实现定性和定量分析。
研究流程主要包含以下关键步骤,涉及了系统构建、优化、验证以及AI算法开发与应用的完整链条。
第一,vc-PCR系统的原理建立与初步验证。 本研究基于团队前期开发的vc-PCR技术。该技术的核心在于向反应体系中添加牛血清白蛋白(Bovine Serum Albumin, BSA)。在95°C加热时,BSA会形成水凝胶基质,通过非共价作用暂时“捕获”Taq DNA聚合酶,从而控制其释放速度,实现扩增过程的“调速”。这一机制同时使得体系能够耐受高浓度的SYBR Green I染料(常规qPCR中高浓度染料会抑制聚合酶活性),而不影响扩增效率。高浓度的染料确保了反应全过程(尤其是平台期)的荧光信号被充分标记,从而使得终点荧光值(End RFU)与起始模板量之间可能建立更稳定的关系,为无需标准曲线的绝对定量提供了潜在可能。研究首先比较了常规qPCR与vc-PCR的表现。结果显示,常规qPCR在使用1× SYBR Green I时,仅在低引物浓度(62.5-125 nM)下End RFU与引物浓度呈线性相关,且增加染料至8×会导致严重的扩增抑制。而当在8×染料条件下加入BSA(5 mg/mL)后,抑制被完全消除,End RFU显著提高,证明了BSA的保护作用。
第二,多重vc-PCR系统的系统化优化。 为构建稳定可靠的多重检测体系,研究者对影响vc-PCR性能的多个关键参数进行了系统测试。采用单因素变量法,在单重(monoplex)反应中,考察了BSA浓度(1-20 mg/mL)、SYBR Green I浓度(1-16×)和引物浓度(62.5-1000 nM)的组合效应。通过分析不同条件下End RFU与引物浓度的线性关系(以决定系数R² ≥ 0.990为标准)、End RFU绝对值以及Ct值,最终确定最优反应体系为:5 mg/mL BSA、8× SYBR Green I、总引物浓度不超过500 nM。此组合在保证高荧光信号和低Ct值(高扩增效率)的同时,确保了End RFU在宽引物浓度范围内与浓度呈良好线性,这是后续通过调整不同靶标引物浓度来区分信号的基础。此外,研究还考察了扩增产物长度的影响,发现约50 bp的短片段产物在vc-PCR中稳定性更高,受高浓度染料抑制的影响更小,因此后续所有引物均设计为产生45-55 bp的产物。
第三,靶标选择与多重检测策略设计。 研究选取了三种关键的口腔致龋菌作为模型靶标:变形链球菌(Streptococcus mutans, S. mutans)、嗜酸乳杆菌(Lactobacillus acidophilus, L. acidophilus)和粘性放线菌(Actinomyces viscosus, A. viscosus)。为了在不依赖熔解曲线或多荧光通道的情况下区分不同细菌的扩增信号,研究采用了基于End RFU差异化的策略。通过理论建模和计算,研究者设定了不同靶标引物的浓度梯度,使得每种细菌在单独扩增时产生显著不同的End RFU值。具体地,通过建立End RFU与引物浓度的线性方程、Ct值与引物浓度的方程,并结合总引物浓度限制(500 nM)和End RFU动态波动范围(约±6.4%)等约束条件,经过帕累托最优区间分析,最终确定了A. viscosus、L. acidophilus和S. mutans的优化引物浓度分别为100 nM、150 nM和200 nM。理论计算对应的End RFU目标值分别约为1000、1500和2000,实验验证的扩增效率分别为76.5%、78.3%和88.9%。这种设计旨在使三联检测中,即使三种细菌共存,其总End RFU和各目的信号贡献也能通过预设的浓度差进行区分。
第四,双联与三联vc-PCR的可行性探索与现象分析。 在优化系统的基础上,研究首先进行了双联vc-PCR实验。将三种细菌的基因组DNA进行10倍梯度稀释并随机混合,生成了37种不同浓度比例的组合样本。实验观察到了多种典型的扩增曲线形态:1)当两种模板浓度相近且引物效率相当时,实际双联曲线与将两条单重曲线叠加的预测曲线高度吻合,呈现单一线性增长期,表明扩增干扰小。2)当两种模板浓度存在差异(如10倍)时,曲线仍可能呈现单一线性期,但其斜率发生变化,斜率值可以反映两种细菌的浓度高低顺序,可用于半定量分析。3)当浓度差异极大(≥1000倍)且引物效率相近时,曲线可能呈现两个清晰的线性期,中间出现拐点。拐点处的RFU值近似等于高浓度模板单独扩增的End RFU,这为半定量判定高浓度模板提供了直观指标。4)当浓度差异大且引物效率不同时,会出现更复杂的曲线,如平台(暂停)期,这反映了高效率引物先导扩增可能导致的模板优势和聚合酶消耗问题。这些现象系统地揭示了在vc-PCR体系下,模板浓度比、引物效率差异与最终扩增曲线形态之间的内在联系,为AI算法的特征提取奠定了实证基础。
随后进行的三联vc-PCR实验复杂度更高。使用37种不同浓度比例的三菌混合样本进行测试,将结果归纳为13种典型情况。分析发现,当扩增效率较高的S. mutans不是浓度最低的菌种时,其扩增会显著影响其他菌种的扩增效率,导致曲线变形,实际曲线与预测曲线相似度较低。研究引入了曲线下面积(AUC)等指标进行相似性评估。这些结果明确显示,仅凭人工观察解析三联扩增曲线以确定各菌种存在与否及其相对浓度是极具挑战性的,这凸显了引入人工智能辅助分析的必要性。研究还评估了三联vc-PCR的灵敏度,计算了三种菌的检测限(Limit of Detection, LOD),分别为A. viscosus 1.13倍稀释度、L. acidophilus 1.20倍稀释度、S. mutans 2.10倍稀释度,证明了该方法具有良好的检测灵敏度。
第五,人工智能分析框架的开发与应用。 为解决多重vc-PCR曲线的解析难题,本研究开发了两套AI框架。首先,针对双联vc-PCR,研究者构建了一个包含1440次扩重复实验(210次单重、410次双联、820次三联)的数据集。从每条扩增曲线中提取了10个形态学特征(如均值、标准差、最大/最小值、斜率指标、方差比、线性趋势等)。通过比较多种算法,最终选择XGBoost算法来区分曲线是“单线型”(一种模板主导)还是“双线型”(两种模板依次扩增)。利用SHAP(Shapley Additive Explanations)进行特征重要性分析,发现斜率标准差和最大End RFU是影响分类的最关键特征。对于分类后的曲线,再通过数值插值和预设的线性回归模型(基于不同扩增顺序下的效率标准曲线)来计算各模板的绝对拷贝数。在40例临床样本(模拟一种菌浓度极低的情况)的验证中,AI辅助的双联vc-PCR在半定量分析(判断哪种菌浓度高)中达到了100%的准确率,而人工判读为80%。在绝对定量分析中,对A. viscosus和L. acidophilus的混合样本检测显示,平均绝对定量误差仅为3.7%。
其次,针对更为复杂的三联vc-PCR,研究开发了基于模式识别的AI框架。该框架采用了一种改进的k-NN(k=1)算法,并创新性地融合了两种曲线相似性度量方法:均方根误差(RMSE)和形状动态时间规整(shapeDTW)。通过对1036个训练样本和250个验证样本的优化,确定了shapeDTW的权重为1(即完全依赖shapeDTW进行相似性评分)。该算法将待测曲线与数据库中的已知曲线进行匹配,将相似度最高的曲线类型作为判读结果。在66份包含三种细菌的临床样本测试中,AI辅助的三联vc-PCR在半定量分析中的准确率从人工判读的54.5%显著提升至93.9%,展现了AI在处理高度复杂生物信号方面的巨大优势。
本研究的主要结论是,成功建立并验证了一种集成了人工智能的多重速度控制qPCR(AI-assisted multiplex vc-PCR)系统。该系统能够在单一荧光通道内,仅使用标准的SYBR Green I染料和引物(无需昂贵探针),实现对多种病原体(本研究以三种口腔细菌为例)的高通量、高灵敏度、实时定量检测。该方法不仅支持定性检测,还能实现高精度的半定量和绝对定量分析。
该研究的价值体现在多个层面。在科学价值上,它将vc-PCR这一新型扩增控制机制成功地拓展至多重检测领域,揭示了在可控扩增速度下多重反应动力学的复杂性和规律,为多重核酸定量检测提供了新的理论基础和技术路径。在技术方法上,创造性地将高浓度BSA与高浓度SYBR Green I结合,解决了染料抑制与信号强度之间的矛盾;通过精细调控引物浓度实现信号区分,简化了检测设计;最重要的是,深度融合了人工智能(XGBoost、改进k-NN、shapeDTW等算法),有效解决了复杂扩增曲线的解析难题,为分子诊断的智能化数据分析提供了范例。在应用价值上,该方法成本低廉、设备要求简单(仅需单通道荧光PCR仪),且具有高精度和高通量的特点,为临床感染性疾病(如龋病风险评估、呼吸道多病原检测等)、环境微生物监测和公共卫生领域的快速、精准诊断提供了一种极具潜力的新工具。
本研究的亮点突出。重要发现方面:明确了在vc-PCR体系中,BSA浓度、染料浓度和引物浓度对多重检测性能的协同影响规律;系统刻画了双联/三联检测中,模板比例、引物效率差异与扩增曲线形态(单线、双线、拐点、平台期)的对应关系;实证了通过AI算法(特别是融合shapeDTW的k-NN方法)能够极高精度地解析三联扩增曲线。方法新颖性方面:首创了“多重vc-PCR + AI”的整体解决方案,将物理层面的反应控制(BSA水凝胶)与数据层面的智能解析深度融合;开发了专门用于处理时间序列形态相似性的AI融合框架(shapeDTW + RMSE);建立了从理论建模(引物浓度优化)到实验验证再到AI模型构建的完整研发闭环。研究对象的特殊性:以口腔多菌种致龋微生态为模型,体现了从临床实际问题出发,开发针对性解决方案的研究思路,具有明确的转化医学导向。
此外,研究还探讨了将熔解曲线分析与多重vc-PCR结合的可能性,发现由于染料充足,熔解曲线信号更强、更具区分度,可作为辅助验证手段。研究也指出当前方法的一些局限性,如目前最多检测三种靶标、扩增效率在多重反应中仍会下降、AI精度尚未达到100%等,并为未来研究方向提出了建议,包括优化Taq酶等其他试剂成分,以及探索更先进的算法(如卷积神经网络CNN)来进一步提升性能。这些内容展示了研究者客观严谨的科学态度和对技术持续改进的展望。