长读长测序技术在临床环境中的应用:综述报告
本文为发表于期刊 Human Genomics (2023年,第17卷,第73期) 的一篇开放获取综述文章。作者包括 Josephine B. Oehler, Helen Wright, Zornitza Stark, Andrew J. Mallett 和 Ulf Schmitz*,其所属机构涵盖了澳大利亚詹姆斯·库克大学、墨尔本大学、默多克儿童研究所、汤斯维尔大学医院、昆士兰大学、百年研究所以及悉尼大学等多家研究机构。文章旨在全面审视长读长测序(Long-read sequencing, LRS)这一第三代测序技术在临床诊断、治疗选择及远程医疗等场景中的应用现状、潜力与挑战。
核心主题与背景 文章的核心主题是探讨以牛津纳米孔技术(Oxford Nanopore Technologies, ONT)和太平洋生物科学(Pacific Biosciences, PacBio)为代表的长读长测序技术如何革新临床基因组学实践。作者指出,尽管以Illumina平台为主导的短读长测序(Short-read sequencing, SRS)在过去二十年是基因分析的金标准,但其在读取长度上的局限性(通常约150个碱基对)导致其在解析复杂基因组区域时存在固有缺陷。这些缺陷包括难以准确识别结构变异(Structural variants, SVs)、无法有效测序重复元件、等位基因定相(单倍型分型)困难,以及在分析高度同源的基因簇时分辨力不足。此外,SRS通常需要PCR扩增,可能引入偏差并掩盖天然的碱基修饰信息。LRS技术的出现,能够产生数万甚至数十万碱基长度的读长,且无需PCR扩增,可直接检测碱基修饰(如甲基化),从而为克服这些挑战提供了强大工具,使其在精准医学领域展现出巨大潜力。
主要论点与论据阐述
论点一:长读长测序技术原理与平台发展日趋成熟,为临床应用奠定基础。 文章详细介绍了目前LRS领域的两个主要技术平台:PacBio的单分子实时(Single-molecule real-time, SMRT)测序和ONT的纳米孔测序。PacBio SMRT技术通过检测聚合酶合成DNA时荧光标记核苷酸的掺入来实现测序,其早期版本错误率较高,但通过环形一致性测序(Circular Consensus Sequencing, CCS)产生的HiFi读长已将准确度提升至与Illumina测序相当的水平(Q30以上)。其最新平台Revio系统每天可产生高达360GB的HiFi数据,准确度达Q33。ONT技术则基于DNA分子穿过纳米孔时引起的特征性电流变化来识别碱基序列。该技术具有实时、便携、起始DNA需求量低等优点。近年来,ONT通过引入自适应采样(Adaptive Sampling)等计算富集技术、改进化学试剂(如v14化学试剂与R10.4.1孔道)和碱基识别算法,显著提升了测序准确度(达到Q20+)和效率。正是由于LRS在读取基因组、转录组和表观基因组方面的独特能力,它被《自然-方法》杂志评为“2022年度方法”。
论点二:LRS在罕见病诊断中展现出突破性潜力,能解决传统测序的盲区。 大量疑似孟德尔遗传病患者(约50%)无法通过传统方法获得分子诊断。LRS技术正成为终结这种“诊断奥德赛”的关键。其临床价值体现在多个层面: 1. 解析短串联重复(Short tandem repeat, STR)扩展疾病:如Stevanovski等人的研究所示,利用纳米孔测序进行靶向分析,可在单一检测中无偏倚地确定所有已知神经致病性STR位点的大小和序列,成功诊断亨廷顿病、脆性X综合征等疾病,有助于理解基因型-表型关联。 2. 识别复杂结构变异和同源基因变异:LRS能够检测到SRS遗漏的致病性结构变异。例如,首例临床全基因组LRS成功识别了导致Carney综合征的2.2-kb缺失。在影响色觉的疾病中,LRS能够有效区分高度同源的OPN1LW/OPN1MW基因簇,识别其中的结构和核苷酸变异。 3. 提高内含子变异检出率:以Gitelman综合征为例,传统方法只能在部分患者中发现一个SLC12A3基因致病突变。而通过LRS,Viering等人发现,在先前仅发现一个突变的患者中,高达67%的人存在第二个可能致病的内含子变异,且携带两个变异的患者电解质表型更严重。这凸显了LRS在筛查内含子区域、提高诊断率方面的重要性。 4. 实现危重患者的超快速诊断:斯坦福大学的研究团队开发了超快速纳米孔全基因组测序流程,平均8小时即可为危重患者提供遗传诊断,最快纪录为5小时2分钟。这种速度对于指导临床紧急决策(如心脏移植、调整用药)具有革命性意义。
论点三:在肿瘤学领域,LRS为基因组、转录组和表观遗传学的多层分析提供了强大工具。 LRS在癌症研究中的应用已取得显著成果,其临床潜力体现在: 1. 精准检测癌症相关结构变异:LRS能更有效地发现拷贝数平衡的结构变异和复杂重排。例如,研究利用MinION在胰腺癌细胞系中检测到CDKN2A和SMAD4肿瘤抑制基因的功能缺失变异(易位、倒位、缺失等);在乳腺癌细胞系中,LRS精准揭示了ERBB2基因扩增位于8号染色体的复杂重排内部,而这是SRS难以实现的。 2. 快速诊断与分型:针对中枢神经系统肿瘤,研究者建立了基于MinION的1天诊断流程,成功识别了1p/19q共缺失、EGFR等基因的局灶性扩增等诊断相关改变。在血液肿瘤方面,针对急性髓系白血病(AML)常见突变基因(如NPM1, FLT3)的纳米孔靶向测序,可将检测时间从约7天缩短至24小时,成本降至约200美元,实现了快速、经济的基因分型。 3. 全面解析融合转录本:LRS能够对全长cDNA进行测序,从而准确鉴定转录本异构体结构。在白血病等需要快速分型指导治疗的疾病中,基于纳米孔的测序可在15分钟内检测到BCR-ABL1融合转录本。新开发的算法(如JAFFAL)能有效处理LRS数据中的高错误率,从而发现新型融合基因。 4. 直接检测癌症表观遗传改变:LRS(尤其是纳米孔测序)可直接检测DNA甲基化等修饰,无需亚硫酸氢盐处理,避免了DNA降解和PCR偏差。研究证明,利用LRS获取的全基因组5-甲基胞嘧啶图谱可用于脑肿瘤的分类,区分了82种不同的肿瘤实体。这为基于表观遗传特征的肿瘤诊断开辟了新途径。
论点四:在传染病与微生物组学中,LRS凭借其快速、便携的特点,在病原体监测、耐药性检测和感染诊断中发挥关键作用。 LRS,特别是便携式纳米孔测序仪,在传染病防控中显示出独特优势: 1. 疫情实时基因组监测:在2015年西非埃博拉疫情和COVID-19大流行中,ONT设备的便携性和快速周转能力使其能够在现场或资源有限的环境中进行实时病毒基因组测序,用于追踪传播链、监测病毒进化、验证诊断试剂。虽然Illumina测序仍是COVID-19病毒基因组监测的金标准,但纳米孔测序在通量灵活性(从Flongle到PromethION)和快速响应方面具有互补价值。 2. 应对新发传染病:在2022年猴痘病毒(MPXV)疫情中,基于扩增子的MinION测序方案克服了Illumina平台对高病毒载量和复杂实验室基础设施的依赖,能够在Ct值高达30的样本中生成高质量基因组,为资源有限地区的监测提供了可行方案。 3. 助力消除疟疾和结核病:LRS可用于快速检测疟原虫的耐药基因突变(如P. falciparum的Kelch13 C580Y突变),并分析疾病传播动态。在结核病治疗中,MinION可用于现场快速鉴定结核分枝杆菌的耐药突变,实现个性化治疗。 4. 分析微生物组与性传播感染:LRS可用于直接对临床样本(如尿液)中的病原体(如淋病奈瑟菌)进行测序,近乎完整地重建其基因组,用于耐药性分析和流行病学调查。此外,针对阴道微生物组等,LRS能够实现高分辨率、快速(4小时)且经济高效的菌群分析,为临床微生物检测提供了新思路。
论点五:LRS在移植医学中实现了高分辨率HLA分型,并有助于理解移植相关并发症的机制。 LRS技术革新了人类白细胞抗原(Human leukocyte antigen, HLA)分型领域: 1. 高精度HLA分型:LRS能够准确识别罕见和复杂的HLA等位基因,这对于供受者匹配和预测移植后结局至关重要。研究利用PacBio LRS对肾移植受者队列进行HLA分型,发现特定HLA等位基因与急性排斥反应风险增加相关。 2. 解析移植并发症:利用纳米孔测序对参与移植物抗宿主病(Graft-versus-host disease, GVHD)的免疫细胞进行转录组分析,可以识别与GVHD发生和严重程度相关的基因表达模式,为理解其分子机制和开发靶向疗法提供依据。 3. 研究KIR基因多样性:LRS有助于全面了解杀伤细胞免疫球蛋白样受体(Killer-cell immunoglobulin-like receptor, KIR)基因的多样性及其对移植结果的影响。
论点六:便携式LRS有望满足偏远和资源有限地区的医疗需求,促进健康公平。 传统测序中心模式因样本运输耗时,限制了快速诊断。便携式LRS设备(如MinION)的出现改变了这一格局: 1. 现场与床边应用:在埃博拉疫情期间,帐篷实验室中的MinION系统可在24小时内(测序仅需13-60分钟)生成结果,证明了其在资源有限环境下的强大应用潜力。这为农村、偏远地区以及重症监护病房(ICU)提供了新的诊断工具。在ICU中,LRS已成功用于快速(6小时内)准确诊断呼吸机相关性肺炎等严重感染,并检测比传统方法更广泛的病原体及其耐药基因。 2. 应对全球健康不平等:便携式LRS可以绕过对昂贵基础设施和大型中心实验室的依赖,使基因组医学更易于在低收入和偏远地区实施,有助于解决全球健康资源分配不均的问题。
论点七:尽管前景广阔,但LRS在临床广泛应用前仍需克服多重挑战。 文章也客观指出了当前LRS技术面临的障碍: 1. 数据验证与平台稳定性:需要严格的验证研究来确保LRS数据在检测临床相关变异方面的准确性和可靠性。同时,测序平台的长期稳定性和一致性对于常规临床实践至关重要。 2. 标准化与质量控制:缺乏统一的标准化协议和质量控制指标,需要建立共识以确保不同实验室和平台间数据的可比性和可靠性。 3. 成本效益与工作流程整合:虽然“每碱基成本”在下降,但LRS的整体成本效益、工作流程效率以及与现有临床路径的整合仍需优化。研究表明LRS对复杂基因组重排的诊断率更高,但需平衡其成本与产出。 4. 生物信息学分析工具:LRS数据特性与SRS不同,需要专门的分析工具进行碱基识别、错误校正、组装和分型。目前尚缺乏社区公认的标准算法和工具集。 5. 样本质量与预处理:获得高分子量、高质量的DNA是进行超长读长测序的前提。在偏远地区,样本提取和处理的标准化是保证数据质量的关键。需要开发更简单、自动化的文库制备方案(如ONT的VolTRAX系统)以减少人为误差和时间。 6. 临床实施与生态系统建设:将LRS整合入医疗系统不仅涉及实验室检测,还包括前期的信息咨询、遗传咨询以及后期的结果解读和临床决策支持。这需要建立适当的治理框架、培训专业人员、制定国家统一的实施指南和安全质量标准,并考虑测试地点(社区、医院或中心实验室)的混合模型。
结论与展望 文章总结指出,PacBio和ONT的LRS技术各有优势:PacBio以其高准确度和长读长适用于需要精确检测单核苷酸多态性(SNP)和单倍型分相的应用;而ONT则以其实时性、便携性、快速周转和低起始DNA需求,更适合现场、床旁或需要快速SNP检测的场景。此外,长短读长混合测序(Hybrid sequencing)结合了二者的优点,在从头基因组组装和复杂基因组研究中价值显著。未来选择何种技术取决于具体的应用需求。
LRS技术正在为遗传病、癌症和传染病的诊断与治疗开辟新途径。要将其成功整合到医疗保健体系中,需要在测序设备、技术开发、人员培训和跨机构合作方面进行投入。尽管目前仍面临成本、数据复杂性、临床验证不足等挑战,但一旦这些障碍被克服,LRS有望成为基因组分析的标准突破性技术,在广泛的临床和远程环境中实现精准医学的广泛应用。
文章的价值与意义 本综述系统性地梳理了长读长测序技术在多个关键临床领域的最新应用进展,从技术原理到具体病例,从优势到挑战,提供了全面而深入的视角。它不仅是一份技术现状的总结,更是一份推动该技术从研究向临床转化的路线图分析。文章强调了LRS在解决传统测序技术瓶颈、实现快速精准诊断、以及促进健康公平方面的革命性潜力,为临床医生、研究人员和政策制定者理解并采纳这一前沿技术提供了重要的参考依据。