关于罕见错义变异WNT16和ERVW-1导致系统性红斑狼疮的全基因组测序研究报告
一、 研究作者、机构与发表信息
本研究由陈建海(Jianhai Chen)与张平(Ping Zhang)作为共同第一作者,吴永康(Yongkang Wu)作为通讯作者主导。研究团队主要来自四川大学华西医院的实验医学科(Department of Laboratory Medicine)以及系统遗传学研究所(Institutes for Systems Genetics)。合作单位包括武汉的生物转导实验室(Bio-transduction Lab)以及卫生部移植工程与移植免疫重点实验室(Key Laboratory of Transplant Engineering and Immunology, Ministry of Health)。该研究成果发表于期刊《Genomics》第114卷(2022年),文章编号110332,已于2022年3月10日在线发表。这是一篇遵循CC BY-NC-ND许可的开放获取文章。
二、 研究背景与目标
本研究属于人类复杂疾病遗传学,特别是自身免疫性疾病遗传学领域,聚焦于系统性红斑狼疮(Systemic Lupus Erythematosus, SLE)。SLE是一种慢性、潜在致命的自身免疫性疾病,以自身免疫耐受破坏、持续产生自身抗体、免疫复合物形成以及多器官系统炎症为特征。其全球患病率约为0.1%,在女性中更为常见。流行病学研究已证实SLE具有高遗传度(>66%)。
尽管全基因组关联研究(Genome-Wide Association Study, GWAS)已在欧洲和东亚人群中发现了数百个与SLE相关的常见遗传变异,但这些变异通常效应值较小,且难以精确定位到致病基因,导致SLE的遗传度存在大量“缺失的遗传力”。进化理论预测,有害突变在群体中应较为罕见,因为它们受到纯化选择的作用。因此,具有较大功能效应的罕见变异可能是解释这部分缺失遗传力的关键。此前,一项基于欧洲人群的全基因组测序(Whole-Genome Sequencing, WGS)研究已证实罕见变异对SLE有重要影响。然而,针对中国SLE患者,尚缺乏基于WGS的罕见变异研究。此外,SLE的发病风险存在种族差异,凸显了在不同祖先人群中全面描绘其遗传变异谱的重要性。
本研究旨在通过一项基于家庭的WGS研究,在中国SLE患者中识别具有较大效应值的新型罕见变异。研究目标包括:1)利用WGS技术对来自三个中国家庭的SLE患者及其未患病家庭成员进行测序;2)基于大规模群体频率数据(gnomAD数据库)筛选罕见、具有破坏性或序列改变效应的蛋白编码基因变异;3)评估罕见变异在患者中的遗传负荷;4)鉴定与SLE状态共分离的致病性罕见变异;5)通过生物信息学分析和体外功能实验验证候选基因变异的功能影响。
三、 详细研究流程
本研究流程严谨,整合了基因组学、生物信息学和分子生物学实验方法。
1. 样本收集与临床信息: 研究纳入了来自中国西部三个家庭的16名个体,包括7名符合美国风湿病学会(ACR)1982年诊断标准的SLE患者和9名未患病的家庭成员作为对照。所有参与者均为女性,最早发病年龄为18岁。样本采集和实验方案获得了四川大学华西医院伦理委员会的批准。
2. 全基因组测序与变异检测: 对16个样本进行了全基因组测序(Illumina HiSeq X,150 bp双端测序,平均插入片段350 bp)。使用fastp软件进行原始数据质量控制、接头修剪和过滤。将质控后的序列比对到人类参考基因组(hg38),使用BWA软件。随后,遵循GATK最佳实践流程,进行排序、标记重复序列和碱基质量值重校准。使用GATK HaplotypeCaller工具调用单核苷酸变异(SNVs)和小片段插入缺失(indels)。平均测序深度为31.89×,足以进行准确的变异检测。最终获得了超过1100万个SNV和小indel变异。
3. 遗传背景与群体结构分析: 为确保后续分析的准确性,研究首先验证了家庭关系的真实性并确定了样本的群体来源。 * 亲缘关系与近交分析: 使用PLINK软件分析所有个体的纯合片段(Runs of Homozygosity, ROH)。结果显示所有个体在常染色体上的ROH水平相似,表明不存在可检测的近交负荷,排除了常染色体隐性遗传模式的预期。 * 遗传距离聚类: 基于全基因组状态同一性(Identity by State, IBS)模型进行聚类分析,结果与家庭口头描述的关系一致,确认了家庭内成员的紧密遗传关系,并推断其中一个家庭中的双胞胎姐妹为异卵双胞胎。 * 群体主成分分析(Principal Component Analysis, PCA):将本研究样本与“千人基因组计划”中26个全球人群的数据合并进行PCA分析。结果显示所有研究样本均聚类在东亚人群内部,证实了其东亚血统。这为后续使用gnomAD数据库中东亚人群数据作为参考来定义罕见变异提供了依据。
4. 罕见变异负荷分析与候选变异筛选: * 变异分类与负荷比较: 基于gnomAD数据库v3.1的东亚人群等位基因频率数据,将变异分为罕见(MAF < 0.01)、较不常见(0.01 < MAF < 0.05)和常见(MAF > 0.05)。通过比较病例和对照之间的等位基因频率差异,将罕见变异进一步分为“病例富集”或“对照富集”。统计分析发现,SLE患者中罕见变异的遗传负荷显著高于常见变异(OR = 1.029, p < 0.0001),这与先前欧洲人群的研究结果一致。 * 候选变异识别流程: 研究设计了一套严格的生物信息学筛选流程来识别致病变异: * 影响预测与频率过滤: 使用Ensembl 变异效应预测器(Variant Effect Predictor, VEP)和SnpEff工具对变异进行注释。仅保留预测为“高”(如移码、无义突变)或“中度”(如错义突变)影响的变异。同时,筛选在gnomAD数据库中频率低于0.01或未收录的罕见变异。 * 共分离与关联分析: 使用PLINK进行病例-对照共分离分析,重点关注能解释所有或大多数病例的变异。对全基因组变异进行比值比(Odds Ratio, OR)检验,仅保留OR显著(p < 0.05)且95%置信区间下限大于1的变异。 * 多重罕见变异关联检验验证: 为验证手动筛选的结果,使用RVTests软件包进行了16种不同的罕见变异关联检验(包括单变异检验、负担检验、可变阈值模型检验和核模型检验)。
5. 候选变异的生物信息学分析: * 系统发育保守性分析: 从Ensembl数据库获取候选变异位点在灵长类物种中的直系同源序列比对,评估其进化保守性。 * 蛋白质结构预测: 对于在WNT16基因中发现的错义变异,从AlphaFold蛋白质结构数据库下载了野生型蛋白的预测三维结构。由于突变位点(第86和87位丙氨酸)的预测置信度很高,研究使用本地AlphaFold2流程预测了突变型(丙氨酸变为脯氨酸)的结构,以评估潜在的二级结构变化。 * 基因表达谱查询: 利用GTEx和HPA数据库的群体RNA-seq数据,查询了候选基因在多种组织中的表达情况。
6. 体外功能实验验证: * WNT16的荧光素酶报告基因实验: 为了测试WNT16野生型和突变型在激活经典Wnt/β-catenin信号通路中的功能差异,研究在Jurkat T细胞中进行了荧光素酶报告基因实验。将含有WNT/β-catenin通路响应元件的TOP-Flash报告质粒与不同剂量(50ng, 100ng, 150ng)的野生型或突变型WNT16表达质粒共转染Jurkat细胞。48小时后检测荧光素酶活性,并以β-半乳糖苷酶活性进行标准化。 * ERVW-1的定量PCR实验: 为了验证ERVW-1野生型和突变型对cAMP/PKA信号通路的响应差异,将野生型或突变型ERVW-1表达质粒转染Jurkat细胞。转染12小时后,加入cAMP类似物(8-Br-cAMP)进行刺激。分别在刺激后24、48、60、72小时提取RNA,通过定量PCR(qPCR)检测ERVW-1 mRNA的表达水平,并以β-actin作为内参基因进行标准化。
四、 主要研究结果
1. 测序与遗传背景确认结果: 成功获得了16个样本的高质量WGS数据,平均深度31.89×,基因组覆盖度>99%。ROH和IBS分析证实了家庭关系的准确性,并排除了近交背景。PCA分析明确将本研究的样本定位为东亚人群,验证了使用东亚人群频率数据的合理性。
2. 罕见变异负荷与候选基因鉴定结果: 遗传负荷分析显示,SLE患者中罕见变异的负担显著高于常见变异,支持了罕见变异在SLE发病机制中具有更大效应的假设。 通过严格的筛选流程,研究鉴定出两个基因(WNT16和ERVW-1)中的罕见错义变异与SLE状态高度相关: * WNT16基因: 发现一个罕见错义变异(NC_000007.14:g.121329757G>C, NP_057171.2:p.(Ala86Pro))在三个家庭的7名患者中的5名(71.4%)存在,而在所有9名对照中均不存在。该变异的OR值为41.8(p=0.02),显示出显著的致病风险。另一个紧密连锁的错义变异(NC_000007.14:g.121329760G>C, p.(Ala87Pro))也被发现。这两个变异在gnomAD数据库中均无记录,表明其在全球人群中极为罕见。多重罕见变异关联检验中,14/16的检验方法支持WNT16与SLE风险显著相关。 * ERVW-1基因: 在未能用WNT16变异解释的两名患者(Wu1和Wu15)以及另外两名患者中,发现了一个由三个完全连锁的罕见错义变异组成的单倍型(rs74545114, rs201142302, rs199552228)。这些变异在所有对照中均不存在。SIFT和PolyPhen工具预测其中两个变异具有有害或可能有害效应。
3. 生物信息学分析结果: * 保守性与结构预测: 多物种序列比对显示,WNT16和ERVW-1的突变位点在灵长类物种中高度保守。AlphaFold2结构预测表明,WNT16的两个突变(Ala86Pro和Ala87Pro)可能导致局部小螺旋结构的丢失,提示其可能对蛋白质功能产生重要影响。 * 表达谱: 公共数据库显示WNT16在皮肤中表达富集,这与SLE常累及皮肤的症状相符。
4. 体外功能实验结果: * WNT16功能丧失: 荧光素酶报告基因实验显示,即使低剂量(100ng)的野生型WNT16也能强烈激活经典Wnt/β-catenin信号通路(激活倍数达5.7倍),而突变型WNT16完全丧失了激活该通路的能力。 * ERVW-1功能异常: qPCR实验表明,在cAMP刺激下,野生型ERVW-1的表达在24小时和48小时显著上调,而突变型ERVW-1在这两个时间点未观察到显著上调。虽然在60小时突变型有上调,但此时野生型的刺激组与对照组已无差异。这表明所发现的ERVW-1突变体影响了其正常的cAMP/PKA信号通路响应。
五、 研究结论与意义
本研究首次通过基于家庭的全基因组测序,在中国SLE患者中鉴定出WNT16和ERVW-1基因的罕见错义变异具有致病风险,并提供了直接的遗传学和体外功能证据。 * 科学价值: 1. 发现新的SLE易感基因: 首次将WNT16和ERVW-1的罕见功能丧失变异与SLE的遗传易感性直接联系起来,为理解SLE的复杂遗传架构提供了新见解。 2. 阐明潜在致病机制: 实验证明WNT16突变导致其激活Wnt/β-catenin经典通路的功能丧失,而该通路在维持正常免疫稳态中起重要作用。这提示Wnt/β-catenin信号通路功能缺陷可能是SLE的一个致病环节。同时,ERVW-1突变影响了其对cAMP刺激的正常反应,为内源性逆转录病毒在SLE发病中的作用提供了新的分子证据。 3. 支持罕见变异假说: 研究结果支持了“罕见变异贡献于复杂疾病缺失遗传力”的假说,并强调在非欧洲人群中进行WGS研究对于发现人群特异性遗传因素的重要性。 * 应用价值: 鉴定出的WNT16和ERVW-1罕见变异可作为潜在的生物标志物,为未来开发针对特定遗传亚型SLE患者的精准疗法提供了可能的靶点。
六、 研究亮点
七、 其他有价值的内容
研究还探讨了WNT16表达可能存在的性别差异(基于GTEx数据),并联系到SLE发病率的性别失衡现象,为未来研究性别与遗传互作提供了线索。此外,研究详细讨论了内源性逆转录病毒(ERVs)通过分子模拟和核酸积累触发干扰素和抗DNA抗体产生的已知理论,将ERVW-1的发现置于更广阔的自身免疫发病机制背景下,增加了发现的生物学合理性。