本研究由来自厦门大学、上海交通大学医学院附属仁济医院和厦门大学附属第一医院的科研团队完成,主要作者包括Xing Xu、Li Lin、Jian Yang、Weizhou Qian、Rui Su、Xiaoxu Guo、Linfeng Cai、Zirun Zhao、Jia Song和Chaoyong Yang。该研究成果于2022年8月26日在线发表于学术期刊《Nano Today》(第46卷,文章编号101596)。
本研究属于单细胞多组学测序技术开发领域,具体聚焦于生命科学和生物医学研究的前沿方向——单细胞基因组与转录组同时测序。单细胞分析技术正在深刻变革生命科学,它能够揭示群体表征所掩盖的细胞异质性。单细胞基因组测序可以揭示细胞间的遗传变异和细胞谱系关系,而单细胞转录组测序则可以描绘mRNA表达谱以识别细胞类型和状态。一个核心的科学问题是理解基因型如何影响单细胞的表型,从而在单细胞水平上全面解读生物遗传规律并解释功能异质性。因此,对同一单细胞进行基因组和转录组的平行测序,对于探索DNA拷贝数、编码区和非编码区如何决定转录组表达水平、建立基因型-表型关系以及揭示重要生物学现象至关重要。
然而,现有的用于同一细胞DNA和RNA同时测序的样本制备技术(如DR-seq、G&T-seq、scTrio-seq、SIDR等)通常操作繁琐、昂贵,且存在交叉污染和灵敏度有限等问题。这些方法大多依赖毛细管将单个细胞移入离心管,并通过特定策略分离DNA/RNA,容易受到细胞分离效率低、核酸固有损失以及全基因组区域分析受限的影响。此外,后续在微升级反应体积中进行核酸扩增,使得来自单细胞的皮克级有效模板被稀释,导致扩增效率低和低丰度信息丢失。整个手动移液过程效率低下且易受外源污染。
近年来,将单细胞分割到微通道、液滴或微孔中的微流控技术极大地促进了单细胞应用。但它们在集成单细胞基因组和转录组测序方面能力不足,主要受限于多层芯片设计的复杂性和多试剂添加的困难。数字微流控(Digital Microfluidics, DMF)是一种基于介电润湿的新兴微流控技术,能够精确控制皮升至纳升级的离散液滴。它具有高集成度、高自动化、高性能、小体积和可扩展性等优点,在单细胞多组学测序中展现出巨大潜力。
基于此,本研究旨在开发一种基于DMF的新型单细胞多组学样本制备平台——DMF-DR-seq,以克服现有技术的局限性,实现高效、灵敏、准确且低成本的单细胞基因组与转录组同时测序,并将其应用于癌症研究,特别是多发性骨髓瘤,以识别关键的驱动基因。
本研究的工作流程是一个高度集成的自动化过程,主要包含平台构建、样本处理、测序与数据分析以及实际应用验证几个核心环节。
1. 平台设计与构建: 研究团队设计并制造了一个集成的DMF系统。该系统核心是一个DMF芯片,由带有图案化电极阵列的底板和作为接地电极的顶板组成,中间由间隔物隔开并填充硅油。底板上设计有不同尺寸的驱动电极和储液池电极,用于纳升级液滴的精确操控。一个关键的创新是在底板上通过剥离技术图案化了一个亲水点,用于基于表面张力差异实现单细胞捕获。整个系统还包括一个自制控制箱(μFluidBox)、控制软件、显微镜和磁场控制装置。通过软件控制电极信号,可以实现液滴的移动、分裂、合并等操作,整个过程可编程且无需熟练技术人员。
2. 单细胞多组学样本制备流程(DMF-DR-seq): 该流程在DMF芯片上原位集成了单细胞分离、DNA/RNA分离和核酸扩增等主要步骤。 * 单细胞捕获与标记: 首先,通过表面蛋白识别,用抗体标记的磁珠与细胞结合。将细胞悬液液滴驱动经过亲水点,在表面张力作用下,单个细胞被捕获并留在亲水点上。细胞浓度低于10^5个/毫升时,单次操作成功率可达95%以上,时间少于30秒。 * DNA/RNA分离: 向捕获细胞的亲水点引入低渗裂解缓冲液(基于SIDR方法),破坏质膜释放RNA,同时保持核膜完整(核孔允许核内mRNA释放)。在磁场作用下,含有总RNA的上清液被转移至RNA反应区,而含有DNA/细胞核的裂解物则保留在亲水点,从而实现RNA和DNA的物理分离。此过程在显微镜下实时监控,以确保充分分离。 * 核酸释放与扩增: 随后,向含有细胞核的残留物中加入碱性裂解液完全裂解释放gDNA,并中和。在RNA反应区,将含有RNA的上清液与引物混合,进行基于SMART-seq2的反转录反应,生成cDNA。同时,在DNA反应区,对DNA裂解物进行多重置换扩增(Multiple Displacement Amplification, MDA)。两种扩增反应在42°C下进行3小时,然后在75°C下进行15分钟。最后,cDNA产物在芯片上进一步进行PCR扩增。 * 产物回收: 扩增后的DNA和cDNA产物分别从芯片上回收,用于后续建库。
3. 测序与生物信息学分析: 回收的核酸产物经过纯化后,分别构建DNA测序文库和RNA测序文库,并使用Illumina HiSeq 4000和NovaSeq测序仪进行测序。 * DNA-seq数据分析: 使用Cutadapt修剪序列,BWA比对到hg19人类基因组,Samtools计算测序深度和覆盖度。使用Ginkgo进行拷贝数变异(Copy Number Variation, CNV)分析,ANNOVAR注释受CNV影响的基因组区域。使用Samtools和BCFtools调用单核苷酸变异(Single Nucleotide Variation, SNV)。 * RNA-seq数据分析: 同样使用Cutadapt修剪,STAR将序列比对到hg19基因组,HTSeq量化基因表达(FPKM值)。使用RSeQC计算reads覆盖度。利用SC3进行聚类分析。使用inferCNV从转录组数据推断拷贝数变化,并与基因组CNV进行相关性分析。使用clusterProfiler进行基因本体(Gene Ontology, GO)富集分析。
4. 研究样本与实验设计: * 平台性能基准测试: 使用三种癌细胞系(SK-BR-3、MCF-7和HCT-116)评估DMF-DR-seq的性能。共生成15对“分馏DNA/RNA”(来自DMF-DR-seq)文库、13个“全DNA”和12个“全RNA”(基于DMF的单组学方法)文库,以及来自1000个细胞群体的8个“批量DNA”和9个“批量RNA”文库作为对照。 * 与传统方法对比: 使用SK-BR-3细胞系,将DMF-DR-seq与传统的SIDR-seq和DR-seq在基因组覆盖度、扩增偏倚、基因检出能力等方面进行直接比较。 * 多发性骨髓瘤实际样本应用: 从三名多发性骨髓瘤患者的外周血/骨髓样本中,使用CD138和CD38抗体标记的免疫磁珠富集并鉴定循环肿瘤细胞(CTCs)/骨髓瘤细胞。利用DMF芯片上液滴的滚动运动模式和基于亲水性的捕获技术,从复杂背景细胞中选择性分离出单个CTC。最终,对来自三名患者的11个CD138+/CD38+单细胞进行了DMF-DR-seq处理和分析。
1. DMF-DR-seq平台性能优异: * 基因组测序方面: 在0.79倍测序深度下,DMF-DR-seq产生的“分馏DNA”数据与“全DNA”及“批量DNA”数据相比,具有可比性的数据质量(高比对率,~5%外显子区、~55%内含子区、~40%基因间区reads分布)。其扩增偏倚(通过变异系数CV和洛伦兹曲线评估)略优于或类似于“全DNA”样本,且基因组覆盖广度(>30%)接近批量样本(34%~39%)。拷贝数变异谱分析显示,DMF-DR-seq的“分馏DNA”与批量数据高度一致(相关系数0.83–0.97),无监督层次聚类能准确按细胞系聚类,证明了其在基因组测序中的精确性。 * 转录组测序方面: DMF-DR-seq的“分馏RNA”数据在比对率、reads分布(>80%位于外显子区,>90%能比对到基因)和检测到的基因数(7000-9000个)方面,与“全RNA”和“批量RNA”数据表现相当。基因表达水平与批量样本呈显著正相关(Pearson相关系数0.83–0.92)。无监督聚类、主成分分析(PCA)、UMAP和t-SNE分析均显示,相同细胞系的数据无论采用何种测序方法都聚集在一起,证明了DMF-DR-seq在转录组分析中的可靠性和可重复性。 * 与传统方法对比: 与SIDR-seq和DR-seq相比,DMF-DR-seq在基因组测序中表现出更低的扩增偏倚(CV=0.54 vs 1.13和0.94)、更高的基因组覆盖度(31% vs 27%和3.5%)以及更均匀的覆盖。在转录组测序中,在4M测序深度下,DMF-DR-seq检测到的基因数约为SIDR的两倍(8817 vs 4995)。虽然DMF-DR-seq在1M深度下检测基因数低于DR-seq,但分析发现DR-seq的高基因检出能力部分源于其工作流程中DNA/RNA未物理分离导致的基因组DNA污染(其基因间区reads比例异常高)。因此,DMF-DR-seq在保持低交叉污染的同时,提供了更全面和准确的单细胞表达谱。
2. 实现基因组与转录组数据的有效整合: 通过对SK-BR-3单细胞数据的分析,发现基因组拷贝数变异(CNV)与染色体表达水平之间存在显著相关性(平均相关系数r=0.63,与SIDR报告的0.60相当)。这种正相关性表明,表达水平部分由遗传拷贝数决定。然而,也观察到了一些不一致的区域(如11号和12号染色体),提示转录表达的波动也可能源于表观遗传影响等其他因素。这证明了同时分析单细胞基因组和转录组对于区分拷贝数变异和其他因素导致的转录变化具有重要意义。
3. 应用于多发性骨髓瘤发现潜在关键基因: 利用DMF-DR-seq对来自三名患者的11个单骨髓瘤细胞进行分析,成功揭示了患者间的基因组异质性。例如,患者2在1、4、13号染色体有明显缺失,患者3在13号染色体也有缺失。通过更深度的测序(26×),检测到了与多发性骨髓瘤预后和耐药性相关的关键基因(如CDKN2C、TP53、ZFHX4等)的突变。例如,患者2存在CDKN2C基因缺失(可能与不良预后相关)和NRAS突变(可能与硼替佐米耐药相关)。 结合基因组和基因表达变异分析,发现大多数缺失基因的对应表达也丢失了。对无表达的缺失基因进行GO富集分析,发现了两个受CNV影响的基因:TAP1和TAP2。这两个基因在与抗原加工相关的GO条目中显著富集。TAP1和TAP2蛋白形成的异二聚体负责将胞质蛋白转运至内质网,对于MHC I类分子呈递抗原肽至关重要。它们在多种人类恶性肿瘤中经常缺失或下调,导致免疫逃逸和不良预后。本研究中三名患者均出现TAP1和TAP2的下调,表明这两个基因可能是多发性骨髓瘤中广泛存在的指标,患者可能对CTLs(细胞毒性T淋巴细胞)等免疫疗法产生抵抗。
本研究成功开发了DMF-DR-seq,这是一种基于数字微流控的单细胞多组学样本制备平台。该平台首次利用微流控技术实现了单细胞全基因组和转录组的同时测序。研究证实,相较于当前最先进的技术,DMF-DR-seq在DNA测序中具有更低的扩增偏倚和更高的全基因组覆盖度,在RNA测序中具有更好的基因检测能力。其优势在于:可寻址、无接触的操作流程;可根据免疫磁珠累积附着和实时荧光识别从背景细胞中特异性选择目标细胞;由于反应体积减小(RNA和DNA文库分别仅需552 nl和259.2 nl),节省了超过100倍的试剂消耗。 通过将该平台应用于多发性骨髓瘤患者单细胞分析,研究者发现了基因组变异诱导的异常转录组表达,并鉴定出两个可能参与病理进程的关键基因——抗原处理相关转运体(TAP1和TAP2)。这证明了多组学分析在有效识别异常基因方面的重要性,也展现了DMF-DR-seq在单细胞生物学更深层次遗传机制研究中的独特灵活性、灵敏度和准确性。
研究还利用DMF-DR-seq产生的多组学数据,改进了单细胞谱系推断的准确性。当仅使用转录组数据时,有少量细胞未能按患者来源正确聚类。而整合线粒体突变信息(来自基因组和转录组测序数据)后,所有细胞都被准确地分组到对应的克隆中。这凸显了DMF-DR-seq这种多组学平台在整合多维度信息以提高分析精度方面的额外价值。