分享自:

纳米孔测序技术的进展及其在研究和应用中的影响

期刊:nature biotechnologyDOI:10.1038/s41587-021-01108-x

纳米孔测序技术及其在基础与应用研究中的应用:技术发展、生物信息学方法与前沿进展综述

作者及发表信息
本文由Yunhao Wang、Yue Zhao、Audrey Bollas等(美国俄亥俄州立大学生物医学信息学系)共同撰写,于2021年11月发表于《Nature Biotechnology》,题为《Nanopore sequencing technology, bioinformatics and applications》。


论文主题与背景

本文是一篇系统性综述,聚焦Oxford Nanopore Technologies (ONT)开发的纳米孔测序技术自2014年首款设备MinION发布以来的快速发展。纳米孔测序利用生物蛋白质纳米孔作为传感器,通过测量单链DNA/RNA分子穿膜时的电流变化实现实时单分子测序。文章全面梳理了该技术在准确性、读长、通量方面的突破,生物信息学分析方法的创新,以及其在基因组学、转录组学、表观遗传学和临床诊断等领域的广泛应用。


主要观点与论据

1. 纳米孔测序的技术原理与发展

核心观点:纳米孔测序的核心是通过纳米孔蛋白(如α-hemolysin或工程化的CsgG)结合马达蛋白(如phi29 DNA聚合酶),控制核酸分子逐步穿过纳米孔,电流信号变化对应核苷酸序列。
技术演进
- 纳米孔设计:从早期α-hemolysin(1.4–2.4 nm孔径)到工程化的CsgG(提升信号稳定性),再到R10版本的双传感区设计(改善同聚物测序准确性)。
- 读长与通量:通过高分子量DNA提取技术(如磁珠筛选、琼脂糖凝胶电泳),最大读长从2017年的800 kb提升至2018年的2.273 Mb;通量从MinION的数百Mb/流式细胞增至PromethION的153 Gb/流式细胞。
- 直接RNA测序:通过适配体连接原生RNA实现直接测序,无需逆转录,但平均准确度较低(83–86%)。

支持证据
- 引用独立研究数据(如R9.4纳米孔读速450 bases/s;R10.3双传感区设计可区分5mC修饰(5-甲基胞嘧啶))[37]。


2. 生物信息学分析方法

核心观点:纳米孔数据的高错误率(6–15%)和长读长特性需针对性开发算法,涵盖碱基识别(base calling)、错误校正和基因组组装等。
关键方法
- 碱基识别:从早期隐马尔可夫模型(HMM)发展为深度学习模型(如Guppy采用的循环神经网络和Flip-flop模型),准确率从65%(R7)提升至94%(R9.4)。
- 错误校正:分为“自我校正”(如Canu通过重叠一致序列)和“混合校正”(如FMLRC利用短读长数据),可将错误率降至1–4%。
- 表观修饰检测:通过电流信号差异识别DNA甲基化(5mC、6mA)和RNA修饰(m6A),工具如Nanopolish、Tombo。

支持证据
- 基准测试显示Guppy在单核苷酸分辨率下检测5mC的准确性优于PacBio[75]。


3. 应用领域与突破

核心观点:纳米孔测序在基因组组装、临床诊断和实时监测等领域展现出独特优势。
应用案例
- 基因组组装:完成人类X染色体端粒到端粒(T2T)无缝组装,填补1.1 Mb缺口[134];用于非模式生物(如科莫多龙、小麦)基因组解析。
- 传染病监测:2015年埃博拉疫情中,MinION在几内亚实现实时测序(15–60分钟/样本)[220];COVID-19疫情期间用于病毒基因组追踪[152]。
- 癌症基因组学:单日流程检测脑肿瘤样本的拷贝数变异和5mC修饰,加速分子诊断[193]。

支持证据
- 引用ONT直接RNA测序验证SARS-CoV-2基因组[153],与传统方法相比节省时间。


4. 当前局限与未来方向

核心观点:技术仍面临错误率高、样本需求量大的挑战,需通过纳米孔工程、算法优化和实验流程改进解决。
未来方向
- 提高准确性:探索非生物纳米孔(如石墨烯孔)以实现单核苷酸分辨率信号[240]。
- 单分子多组学:结合染色质可及性(如SMAC-seq[175])和RNA二级结构分析(如Pore-Cupine[184]),研究单分子表观异质性。
- 自动化与便携性:开发集成样本制备-测序-分析的端到端系统,推动现场应用(如太空站、冰川监测[237])。


论文价值与意义

本文系统总结了纳米孔测序的技术发展、分析工具和应用场景,为研究者提供了以下价值:
1. 技术参考:详述从纳米孔设计到数据优化的全流程,指导实验方法选择。
2. 跨学科应用:涵盖基础研究(如端粒组装)到临床(如快速病原检测)的广泛场景,突显其“长读长、实时性、便携性”三大优势。
3. 前沿展望:指出单分子表观遗传学和低成本个性化基因组学的潜力,推动技术边界扩展。

亮点
- 技术创新:R10双传感区、直接RNA测序等突破性设计。
- 多领域整合:首次将纳米孔测序与表观遗传学、传染病监测等结合,展示技术通用性。
- 开源工具生态:列举40余种生物信息学工具(如Minimap2、Sniffles),促进社区协作。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com