分享自:

大规模并行体内测定TdT突变体产生具有改变核苷酸插入偏好的变体

期刊:ACS Synthetic BiologyDOI:10.1021/acssynbio.4c00414

本研究由来自加州大学尔湾分校、西北大学、亚利桑那州立大学等多个机构的研究团队完成,主要作者包括Courtney K. Carlson、Theresa B. Loveless、Chang C. Liu(通讯作者)等。该研究成果于2024年10月18日发表在期刊 ACS Synthetic Biology 上。

学术背景 本研究属于合成生物学和分子工程交叉领域,聚焦于末端脱氧核苷酸转移酶(Terminal deoxynucleotidyl transferase, TdT)的工程化改造。TdT是一种独特的DNA聚合酶,能够以模板非依赖的方式,在DNA的3‘末端随机添加脱氧核苷酸。这种de novo DNA合成的能力使其在DNA记录(DNA recording)、DNA数据存储、寡核苷酸合成以及核酸标记等应用中展现出巨大潜力。然而,野生型TdT在核苷酸插入时存在固有的偏好性,倾向于插入鸟嘌呤(G)和胞嘧啶(C),这种偏向性限制了其在需要高随机性或特定序列组成的应用中的普适性和效率。例如,在用于细胞谱系追踪的DNA记录系统中,偏向性会降低每个插入核苷酸的信息熵(Shannon entropy),增加不同细胞谱系产生相同“条形码”的概率(即同塑性,homoplasy),从而干扰谱系关系的准确推断。另一方面,在旨在记录多种生物信号的系统中,具有不同偏向性的TdT变体则可能成为区分不同信号来源的关键工具。因此,如何高通量地鉴定并改造TdT,以获得具有不同核苷酸插入偏好性和活性的变体,成为拓展TdT应用范围的关键科学问题。本研究的主要目标,正是开发一种能够在活细胞(*in vivo*)中并行分析数以万计TdT突变体活性和偏向性的方法,并利用此方法筛选出具有新特性的TdT变体,以提升DNA记录系统的性能,并为TdT的其他应用提供新工具。

详细工作流程 本研究主要包括四个关键步骤:TdT突变体库的设计与构建、高通量并行筛选(in vivo multiplex assay)的开发与实施、候选变体的个体验证与体外(*in vitro*)功能验证,以及工程化TdT在DNA记录系统中的应用测试。

步骤一:突变体库的设计与构建。 研究团队选择人类TdT的特定亚型(具有G112残基)作为工程化的起点。基于对TdT晶体结构的分析,他们针对三个可能影响核苷酸选择性的区域设计了三个定点饱和诱变库。库1和库2靶向一个对TdT模板非依赖性活性至关重要的、独特的“套索状”环(Lariat-like loop, Loop1)。库1随机化了该环基底部的三个残基(D399, H400, F401),旨在改变环的运动范围。库2随机化了环1中可能移动并与进入的dNTP接触的三个残基(D396, L398, D399)。库3则靶向了在聚合过程中距离结合核苷酸6Å以内、且指向核苷酸碱基的三个残基(R454, E457, R461),这些残基被认为直接影响核苷酸的选择。每个库使用NNK(N代表任意核苷酸,K代表G或T)密码子随机化三个目标残基,理论上每个库可编码27,783种可能的蛋白质序列(包含终止密码子)。通过优化的两轮PCR克隆策略,成功构建了三个高质量、高覆盖度的TdT突变体文库,并整合到慢病毒表达载体中。该载体设计巧妙地将TdT突变体基因与一个CRISPR-Cas9靶位点(HEK3序列)相邻放置,并包含嘌呤霉素抗性基因和报告基因。

步骤二:高通量并行筛选。 这是本研究的核心创新方法。团队将三个TdT慢病毒文库分别以低感染复数(MOI=0.3)转导HEK293T细胞,确保大多数成功转导的细胞只表达一种TdT变体。通过嘌呤霉素筛选获得稳定表达文库的细胞群体。随后,通过瞬时转染Cas9和靶向TdT基因下游位点的sgRNA,在细胞基因组的目标位点诱导产生DNA双链断裂(DSB)。在接下来的3天里,每个细胞中表达的TdT变体有机会“拦截”该DSB,并在此处添加核苷酸,形成插入突变。最后,收集细胞,提取基因组DNA,通过下一代测序(NGS)同时读取两个关键信息:一是每个读段(read)中包含的TdT变体身份(通过其独特的突变密码子序列识别),二是该TdT变体在同一细胞中所产生的具体插入序列。通过这种“配对读取”方式,研究者能够将成千上万个插入事件与其产生者——特定的TdT变体——直接关联起来。数据分析方面,团队开发了定制化的Python脚本(已在GitHub公开),用于处理测序数据、比对序列、提取突变密码子信息和插入序列、计算每个TdT变体的活性指标(如“插入分数”,即包含插入的读段数/包含任何indel的读段数)和偏好性指标(如插入序列的A/T含量、平均插入长度等)。为确保统计可靠性,分析时设置了严格的标准:只分析获得了至少447条读段(理论上可产生≥250条插入序列)的变体,并重点关注插入分数>0.7的高活性变体。

步骤三:个体验证与体外验证。 为了确认高通量筛选结果的可靠性,研究者从三个文库中选取了74个在偏好性和插入长度上具有多样性的高活性TdT变体,进行个体水平的验证。将这些变体单独克隆到哺乳动物表达载体中,在HEK293T细胞中与Cas9/sgRNA共转染,然后分析HEK3位点的编辑结果。结果显示,个体实验测得的A/T偏向性和平均插入长度与高通量筛选的结果高度相关(皮尔逊相关系数ρ分别为0.952和0.915),验证了高通量方法的准确性。此外,为了探究TdT变体在体外的行为是否与体内一致,研究团队选取了7个代表性变体(包括野生型、两个强A/T偏向型、三个无偏向型、一个强G/C偏向型双突变体以及一个与野生型类似的变体),在大肠杆菌中表达并纯化蛋白,进行了体外延伸实验。实验中,TdT变体在提供四种dNTP的条件下延伸一个单链DNA引物,然后对延伸产物进行测序分析。结果发现,变体在体外表现出的A/T偏向性与体内高通量筛选以及个体验证的结果高度一致(皮尔逊ρ = 0.950),证明了体内筛选结果可有效预测体外功能。值得注意的是,体外实验还提供了在DSB环境下无法获得的更精确信息,例如TdT对A与T、G与C各自的具体偏好排序。

步骤四:在DNA记录系统中的应用测试。 研究团队将他们先前开发的DNA记录系统——细胞历史有序插入记录器(Cell History Recording by Ordered Insertions, CHyRON)——作为验证工程化TdT变体实用性的平台。CHyRON通过TdT在基因组特定位点(包含一个自引导gRNA, homing guide RNA, hgRNA)迭代积累随机插入突变来记录细胞谱系或信号历史。首先,他们将三个“无偏向”的TdT变体(unbiased1, 2, 3)整合到CHyRON系统中,建立了稳定细胞系。经过19天的长期培养和测序分析发现,相较于使用野生型TdT(插入A/T含量37%,每核苷酸香农熵1.93比特),最好的无偏向变体(unbiased3)实现了接近理论最大值(2比特)的1.99比特/核苷酸的信息熵,且编辑效率与野生型相当,从而有效提高了记录的信息密度,降低了同塑性风险。其次,他们尝试利用具有极端偏向性的TdT变体实现“双通道”信号记录。他们构建了两个可诱导的表达盒:一个使用强A/T偏向变体(A/T-biased2, 86% A/T)记录Wnt信号,另一个使用强G/C偏向变体(G/C-biased1, 28% A/T)记录缺氧信号。在分别的测试中,两个系统都表现出对相应诱导剂(Wnt-3a蛋白或缺氧模拟剂DMOG)的剂量依赖性和时间依赖性响应,且插入序列的A/T含量符合预期。最后,他们将两个记录系统共转染到同一个HEK293T细胞群体中,并施加不同组合和顺序的缺氧与Wnt信号诱导。对最终细胞群体CHyRON位点的测序分析表明,他们能够通过插入序列的总编辑程度(反映信号强度/持续时间)和A/T含量(反映信号身份)来部分解读细胞群体所经历的信号历史。例如,仅经历Wnt诱导的样本插入A/T含量高达81-83%,仅经历缺氧诱导的样本A/T含量较低(54-74%),而同时经历两种信号的样本则呈现中间值(61-72%)。

主要结果 1. 成功开发高通量并行筛选方法:该方法成功在HEK293T细胞中对总计25,623个独特的TdT变体进行了活性和偏向性分析,覆盖了所构建文库的绝大部分(77.7%, 71.7%, 68.4%)。活性变体(插入分数>0.7)的A/T偏好性呈现出一个从23%到87%的广泛连续分布,平均插入长度在1-5 bp之间变动。 2. 揭示了影响TdT偏向性的关键残基:通过将变体按偏向性分组并分析其氨基酸组成,发现了一些关键模式。例如,D399残基在G/C偏向型变体中高度保守,而在A/T偏向型中常发生突变,表明它在维持TdT天然G/C偏向性中起重要作用。在库3中,R454、E457和R461三个残基在G/C偏向型中常保持野生型状态,而在A/T偏向型中则被其他氨基酸取代,表明它们是改变TdT偏向性的“热点”。 3. 验证了筛选结果的可靠性:74个变体的个体验证实验表明,高通量筛选测得的A/T偏向性和插入长度与个体实验结果高度相关,证实了该方法的准确性。体外实验结果进一步证实了体内筛选出的偏向性在生化水平上是可复现的。 4. 获得了具有应用价值的工程化TdT变体: * 无偏向变体:成功获得了插入偏好性接近50% A/T的变体(如unbiased3)。在CHyRON系统中,该变体显著提高了插入序列的香农熵,增强了记录的信息密度和唯一性。 * 极端偏向变体:获得了强A/T偏向(~86% A/T)和强G/C偏向(~28% A/T)的变体。 5. 实现了概念验证级的双信号DNA记录:利用具有不同偏向性的TdT变体,研究团队在CHyRON框架内初步实现了对缺氧和Wnt两种生物信号的同时记录与区分。尽管存在Wnt启动子泄漏、编辑速度随时间减慢等需要优化的技术问题,但实验证明了通过分析插入序列的长度和核苷酸组成来推断细胞群体多信号历史的基本可行性。

结论与价值 本研究成功开发并验证了一种前所未有的、在活细胞内并行分析数万种TdT变体功能的高通量筛选方法。利用该方法,研究者系统地绘制了TdT关键功能残基突变对其活性和核苷酸插入偏向性的影响图谱,并成功分离出多种具有新颖特性的TdT变体,包括无偏向型、强A/T偏向型和强G/C偏向型。这些工程化变体立即被用于改进现有的DNA记录系统CHyRON,提高了记录的信息密度,并首次实现了基于TdT偏向性的双通道生物信号记录概念验证。本工作的科学价值在于:1) 提供了一种强大的、通用的酶工程筛选平台,可推广至其他需要改造的聚合酶或核酸酶;2) 生成了一个关于TdT结构-功能关系的大规模数据集,为理解其催化机制和偏向性来源提供了新见解;3) 证明了体内筛选结果与体外功能具有高度一致性,增强了此类筛选方法的可信度。其应用价值则直接体现在:1) 为DNA记录、谱系追踪、DNA数据存储、酶法DNA合成、生物传感等众多领域提供了性能更优的TdT工具酶;2) 为未来开发更复杂、能记录更多信号的多路复用DNA记录器奠定了基础;3) 该方法本身也可用于研究人群中天然存在的TdT变异体,这些变异可能影响T细胞和B细胞受体的多样性,进而与适应性免疫功能相关。

研究亮点 1. 方法学的重大创新:首创了将TdT变体编码与CRISPR-Cas9诱导的DSB编辑结果通过NGS直接关联的高通量并行体内筛选策略,实现了对酶活性和序列输出偏好的大规模并行定量分析。 2. 高通量与高可靠性结合:在单次实验中分析了超过2.5万个TdT变体,并通过严谨的个体验证和体外生化实验,证明了高通量筛选结果的准确性和可移植性。 3. 从筛选到应用的完整闭环:不仅完成了大规模筛选和机理探索,更将筛选获得的有用变体直接应用于改进现有的合成生物系统(CHyRON),并展示了其在解决实际生物学问题(多信号记录)中的潜力,体现了合成生物学“设计-构建-测试-学习”的循环理念。 4. 数据的系统性与开放性:研究提供了所有分析变体的完整性能指标数据库,并公开了分析代码,为领域内其他研究者提供了宝贵的资源。

其他有价值内容 研究在讨论部分展望了工程化TdT变体在其他技术中的潜在应用,例如在DARLIN(另一种多位点DNA记录系统)中用于双信号记录,在酶法寡核苷酸合成平台中用于改善dATP的掺入效率(目前dATP的偶联时间最长)。此外,文中还提及了该方法可用于表征自然发生的TdT变异体,这些变异可能对人类免疫受体多样性产生深远影响,但目前仅有少数在体外被表征过,这为未来的免疫学研究提供了一个新的工具和方向。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com