关于人类诱导多能干细胞中大量体细胞基因组变异及BCOR突变选择的研究报告
一、 研究作者、机构及发表信息
本研究的主要作者包括Foad J. Rouhani, Xueqing Zou, Petr Danecek等,通讯作者为Serena Nik-Zainal。参与研究的机构主要来自英国剑桥大学体系,包括威康桑格研究所、剑桥大学外科系、早期癌症研究所、剑桥生物医学园区医学遗传学学术部以及剑桥大学遗传学系。该研究成果以题为《Substantial somatic genomic variation and selection for BCOR mutations in human induced pluripotent stem cells》的论文形式,于2022年8月11日在线发表于国际顶级学术期刊《Nature Genetics》(2022年9月第54卷,第1406-1416页)。
二、 学术背景与研究目的
本研究属于再生医学与干细胞生物学领域,具体聚焦于人类诱导多能干细胞(human induced pluripotent stem cells, hiPSCs)的基因组安全性评估。hiPSCs因其具有自我更新和分化为多种细胞类型的潜力,已成为疾病体外建模和细胞疗法开发中极具吸引力的模型系统。然而,hiPSCs的基因组完整性和致瘤风险是其在临床应用前必须解决的核心问题。尽管先前已有研究探讨人类多能干细胞的基因组稳定性,但缺乏大规模、单核苷酸分辨率水平的全基因组突变谱系统性评估。
研究背景知识表明,hiPSCs的突变负荷可能来源于:1)其来源的体细胞中预先存在的突变;2)重编程过程、细胞培养和传代过程中新积累的突变。已有一些小规模基因组研究表明,在某些细胞系中,预先存在的体细胞突变构成了总突变负荷的很大一部分。随着使用hiPSCs的临床试验(例如NCT04339764)的开展,深入了解这些细胞的突变景观和潜在风险变得至关重要。
本研究的主要目的是:通过对比来自同一个体的皮肤来源(成纤维细胞来源,f-hiPSCs)和血液来源(内皮祖细胞或红系母细胞来源,b-hiPSCs)的hiPSCs,并全面评估来自世界上最大的干细胞库之一(HipSci)以及另一个独立队列(Insignia)的大量hiPSCs系,系统性地揭示hiPSCs中基因组损伤的程度、起源及其可能的影响。
三、 详细研究流程
本研究是一个综合性、多队列的基因组学分析,结合了实验验证,流程复杂且环环相扣。
流程一:初步比较不同来源hiPSCs的突变负荷。 * 研究对象与样本量: 首先,研究者从一个22岁的健康成年男性(S2)获取了两株独立的皮肤成纤维细胞来源hiPSCs(f-hiPSCs)和两株独立的血液内皮祖细胞来源hiPSCs(b-hiPSCs)。此外,还从其他10名健康供体(6男4女)中分别获取了f-hiPSCs和b-hiPSCs。 * 研究方法: 对所有样本进行全基因组测序(Whole-Genome Sequencing, WGS)。 * 数据分析: 分析单核苷酸替换、双核苷酸替换、小片段插入缺失(indels)的数量和类型。使用突变特征分析工具(如signature.tools.lib R包)解析突变谱,将突变特征与已知的致癌因素(如紫外线(UV)特征、氧化损伤特征)相关联。
流程二:大规模分析HipSci库中f-hiPSCs的突变景观。 * 研究对象与样本量: 分析了来自HipSci干细胞库的452个f-hiPSCs系,这些系源自288名健康个体。其中,324对f-hiPSCs及其匹配的成纤维细胞有WGS数据。 * 研究方法: 对WGS数据进行体细胞突变检测。重点关注突变数量分布、突变特征(尤其是UV特征)、以及突变在转录链和复制时序区域上的偏倚性。 * 数据分析: 鉴定了超过136万个替换、13.5万个CC>TT双替换和5.4万个indels。通过突变特征拟合,量化每个样本中UV特征(COSMIC Signature 7)和氧化损伤特征(Signature 18)的暴露量。分析成纤维细胞和hiPSCs之间共享突变与hiPSCs特有突变的比例和特征。
流程三:探究f-hiPSCs克隆间的基因组异质性及其根源。 * 研究对象: 重点分析了HipSci库中来自同一供体、同一次重编程实验产生的118对f-hiPSCs姐妹系。 * 研究方法: 比较姐妹系之间共享的突变数量、突变谱的余弦相似性。分析亲本成纤维细胞的批量测序数据,通过变异等位基因频率(Variant Allele Frequency, VAF)分布评估成纤维细胞群体的克隆构成(单克隆 vs. 寡克隆)。 * 数据分析: 发现约54%的hiPSCs对共享超过10个突变且谱系相似,而46%的hiPSCs对共享突变极少且谱系不同。亲本成纤维细胞的VAF分析显示,约68%的成纤维细胞是寡克隆群体,含有不同亚克隆。这解释了hiPSCs克隆间巨大差异的来源:每个hiPSCs克隆起源于成纤维细胞群体中的一个单细胞,因此携带了该特定细胞及其祖先细胞的独特突变(尤其是UV损伤)。
流程四:鉴定hiPSCs中具有正选择信号的驱动突变。 * 研究对象: HipSci的452个f-hiPSCs和Insignia项目的78个b-hiPSCs(来自53名遗传性DNA修复缺陷患者、5名环境暴露患者和20名健康对照)。 * 研究方法: 对编码区突变进行选择压力分析。使用dndscv算法计算每个基因的非同义突变与同义突变比率(dn/ds),以识别在hiPSCs群体中受到显著正选择的基因。同时进行突变热点分析。 * 数据分析: 在f-hiPSCs和b-hiPSCs中,只有BCOR基因显示出统计学上显著的正选择信号(f-hiPSCs: q = 3.64 × 10⁻⁸;b-hiPSCs: q = 0)。在HipSci的f-hiPSCs中,2.4%(11/452)携带BCOR截短突变;而在Insignia的b-hiPSCs中,这一比例高达26.9%(21/78)。
流程五:追溯BCOR突变的来源。 * 研究对象: 对携带BCOR突变的b-hiPSCs,研究者从其亲本hiPSCs系中衍生出141个子克隆(每个亲本系衍生2-4个),并进行WGS。 * 研究方法: 检查BCOR突变在亲本hiPSCs、子克隆以及来源的体细胞(红系母细胞)和种系DNA中的存在情况。 * 数据分析: 结果发现:1)所有BCOR突变均未在来源的体细胞或种系DNA中检测到,不支持其来源于克隆性造血(Clonal Hematopoiesis, CH);2)在亲本b-hiPSCs中检测到的BCOR突变,在其衍生的子克隆中均存在;3)更重要的是,有7个亲本b-hiPSCs本身没有BCOR突变,但其部分子克隆却出现了新的BCOR突变。这强烈表明BCOR突变是在hiPSCs体外培养过程中出现并受到选择的。
流程六:验证BCOR突变的功能性影响。 * 研究对象: 选择两个BCOR野生型(bcor-wt)和两个BCOR突变型(bcor-mut)的b-hiPSCs系。 * 研究方法: 1. 转录组学分析: 对78个Insignia b-hiPSCs进行RNA测序,比较bcor-mut与bcor-wt系的全局基因表达差异。 2. 定向分化实验: 将上述四个hiPSCs系定向分化为神经元谱系,在分化第0天(hiPSCs状态)、第6天、第12天(神经干细胞诱导阶段)和第27天(神经元阶段)取样。 3. 形态学与免疫荧光表征: 观察不同阶段的细胞形态,并使用特异性抗体标记多能性标志物(SSEA4, OCT4)、神经干细胞标志物(PAX6)和神经元标志物(TUBB3)。 4. 分化阶段转录组分析: 分析分化过程中多能性、三胚层及神经特异性标志物的基因表达动态。 * 数据分析: RNA-seq主成分分析显示bcor-mut与bcor-wt系在转录组上明显分离。分化实验显示,bcor-mut系在神经诱导阶段效率低下(PAX6表达斑驳),最终神经元生成显著受损(TUBB3阳性细胞减少)。转录组数据证实,bcor-mut系在分化过程中高表达中胚层标志物(如PAX7, TBX1),而神经元标志物上调不足,表明其分化潜能受损,且倾向于偏离神经外胚层方向。
流程七:评估体外培养相关的突变积累。 * 研究对象: HipSci f-hiPSCs的WGS数据,根据传代次数进行分析。 * 研究方法: 将hiPSCs中的突变分为“与成纤维细胞共享的突变”(主要代表体内或早期体外获得的突变)和“hiPSCs特有的突变”(主要代表体外培养过程中获得的突变)。分别分析这两组突变的特征谱,并探究氧化损伤特征(Signature 18)的暴露量与细胞传代次数之间的相关性。 * 数据分析: 氧化损伤特征(Signature 18)在97%的hiPSCs的特有突变中富集,而在80%的hiPSCs的共享突变中几乎不存在。并且,Signature 18的暴露量与hiPSCs的传代次数呈显著正相关(r = 0.327, p = 5.013 × 10⁻⁹),证明长期培养会导致由8-氧代鸟嘌呤(8-oxo-dG)损伤引起的突变积累增加。
四、 主要研究结果
五、 研究结论与价值
本研究得出结论:hiPSCs的基因组完整性受到其来源体细胞的预先损伤(如皮肤细胞的UV损伤)、体外培养过程中的选择压力(如对BCOR突变的选择)以及长期培养累积的氧化损伤的共同影响。
科学价值: 1. 系统性描绘hiPSCs突变图谱: 首次在大规模队列中,以单核苷酸分辨率全面揭示了hiPSCs的体细胞突变景观,明确了不同来源hiPSCs的突变特征和主要风险基因。 2. 揭示克隆异质性根源: 阐明了f-hiPSCs克隆间巨大基因组差异的细胞学基础——亲本成纤维细胞的寡克隆性,这对hiPSCs建系和质量控制具有重要指导意义。 3. 发现新的培养相关选择靶点: 鉴定出BCOR是hiPSCs(尤其是b-hiPSCs)体外培养中一个高频、受强选择压力的突变基因,拓展了对干细胞体外适应机制的认识。 4. 建立突变与功能的联系: 通过实验证实了BCOR突变会损害hiPSCs的分化能力,将基因组变异与细胞功能表型直接关联,强调了基因组筛查的必要性。
应用价值与重要观点: 1. 为hiPSCs的临床应用提供关键安全预警: 研究强烈建议,在将hiPSCs用于疾病建模或细胞治疗之前,必须进行详细的核苷酸分辨率水平的基因组表征。仅核型分析或拷贝数变异筛查不足以评估其基因组安全性。 2. 指导hiPSCs建系的最佳实践: 建议选择预先基因组损伤水平低的体细胞作为起始材料(如血液细胞相对于皮肤细胞),并尽量缩短体外培养时间,以减少突变积累。 3. 提出hiPSCs质量评估新标准: 应将BCOR等特定基因的突变筛查纳入hiPSCs系的常规质控流程,并对hiPSCs的分化潜能进行功能性验证。
六、 研究亮点
七、 其他有价值的内容
研究还指出,在分析hiPSCs突变时,使用匹配的体细胞样本作为对照至关重要。若使用不匹配的种系对照,那些存在于亲本体细胞主要亚克隆中的突变会被误认为是种系变异而被过滤掉,从而错误地低估hiPSCs的DNA损伤程度。此外,对亲本成纤维细胞进行高深度测序能发现更多共享突变,提示标准测序深度可能无法检测到亲本群体中低频存在的变异。这些发现对hiPSCs基因组数据的分析流程和标准制定具有重要的方法论参考价值。