分享自:

玉米中转座因子的调控潜力

期刊:nature plantsDOI:10.1038/s41477-025-02002-z

玉米中转座元件的调控潜力研究学术报告

第一作者及机构
本研究由Kerry L. Bubb和Morgan O. Hamm(共同一作)领衔,团队来自美国华盛顿大学基因组科学系(Department of Genome Sciences, University of Washington)、普林斯顿大学刘易斯-西格勒综合基因组学研究所(Lewis-Sigler Institute for Integrative Genomics, Princeton University)等机构,合作作者包括Thomas W. Tullius、Joseph K. Min等15位研究者。论文于2025年6月发表于Nature Plants(Volume 11, Pages 1181–1192),标题为《The regulatory potential of transposable elements in maize》。


学术背景

研究领域与动机
开花植物基因组中超过80%的序列由转座元件(transposable elements, TEs)构成,这些元件可能通过插入调控区域影响宿主基因表达,但因其高度重复性,短读长测序技术难以精准定位单个TE的调控功能。玉米作为经典模式作物,其基因组中TE的调控潜力尚未系统解析。本研究旨在利用长读长染色质纤维测序技术(fiber-seq),全面绘制玉米B73基因组中可及染色质区域(accessible chromatin regions, ACRs)和CpG甲基化图谱,揭示TE在基因调控中的作用机制。

科学问题
1. TE如何通过染色质可及性和表观修饰动态调控基因?
2. TE衍生的调控元件(如启动子、增强子)如何被宿主基因组“驯化”?
3. TE插入偏好性是否受特定表观特征(如低甲基化)引导?


研究流程与方法

1. 样本制备与实验设计

  • 研究对象:14日龄暗培养玉米幼苗的叶肉原生质体(mesophyll protoplasts),以减少细胞异质性。
  • 技术对比:平行开展fiber-seq和ATAC-seq(assay for transposase-accessible chromatin using sequencing),验证fiber-seq的灵敏度和特异性。
    • fiber-seq原理:利用非特异性DNA N6-腺嘌呤甲基转移酶标记可及腺嘌呤(m6A),结合PacBio单分子测序(~18 kb长读长),同步检测染色质可及性(m6A)和内源性胞嘧啶甲基化(5mCpG)。
    • 创新方法:开发机器学习分类器“fiberseq-fire”,从4.6百万个甲基转移酶敏感片段(methyltransferase-sensitive patches, MSPs)中鉴定106,867个高置信度ACRs(假发现率FDR < 0.01),灵敏度为ATAC-seq的2倍。

2. 数据验证与分析

  • 验证指标
    • fiber-seq与ATAC-seq在启动子区域(CAGE-defined TSSs)信号一致性。
    • 核小体定位周期性(MNase-seq验证)。
  • TE特异性分析:聚焦长末端重复逆转录转座子(LTR retrotransposons),分析其双侧LTR中的ACRs分布及表观特征。

3. 功能机制解析

  • LTR调控元件分类
    • 配对ACRs:94个LTRs双侧存在成对ACRs,兼具启动子(RNA聚合酶结合)和增强子(转录因子结合)功能,表现为低5mCpG甲基化。
    • 单ACRs:499个LTRs保留单侧ACRs(多为增强子),伴随高5mCpG甲基化与可及性共存的特殊表观模式(植物特有)。
  • 进化年龄关联:通过LTR序列相似性评估TE年龄,发现年轻TE更易保留完整ACRs。

4. TE对宿主基因的影响

  • 启动子劫持:12%的ACR阳性LTRs内部含宿主基因,其中48个基因直接利用LTR-ACRs作为启动子。
  • 基因扩增案例:组蛋白去乙酰化酶基因(Zm00001eb318460)因位于LTR内,在玉米B73基因组中扩增出21个高相似拷贝。

5. TE插入偏好性

  • 表观特征引导:Barbara McClintock发现的经典突变位点(如C1基因)具有低基因体甲基化(hypo-5mCpG)和弥漫性染色质可及性,32,000个Hat转座子插入位点同样富集此类特征。

主要结果与逻辑链条

  1. fiber-seq技术优势

    • 检出51,878个ATAC-seq遗漏的ACRs(占总数54%),主要因短元件(<200 bp)或低比对率区域。
    • 单分子分辨率揭示ACR在组织间的“预可及性”(foreshadowing),如TB1基因增强子旁侧ACRs在叶中仅fiber-seq可检测,而在胚芽/花器官中ATAC-seq亦阳性。
  2. LTR调控模式

    • 年轻LTRs(序列相似性99.8%)保留双侧ACRs,衰老后仅增强子ACRs残留(相似性98.7%)。
    • 高5mCpG与可及性共存机制:植物特异RNA介导的DNA甲基化(RdDM)通路可能通过超甲基化抑制TE增强子被宿主利用。
  3. 应用价值

    • 发现76个具有转座潜力的自主性LTRs,为基因组稳定性研究提供靶点。
    • 提出TE通过提供新启动子或促进基因复制驱动基因组演化。

结论与价值

  1. 科学意义

    • 首次系统解析玉米TE的调控多样性,揭示“表观冲突”(可及性与超甲基化共存)的生物学意义。
    • 提出TE年龄依赖的调控元件退化模型,为理解植物基因组可塑性提供框架。
  2. 技术贡献

    • fiber-seq克服短读长局限,实现重复序列中单分子表观分析,可推广至其他复杂基因组。

研究亮点

  1. 方法创新:开发fiber-seq及其分析流程(fiberseq-fire),兼容染色质可及性与甲基化同步检测。
  2. 发现特殊性:植物中首报“高5mCpG-可及性”共存的ACRs,挑战表观标记互斥的传统认知。
  3. 经典问题解答:揭示McClintock发现的TE插入偏好性由低甲基化与弥漫可及性共同决定。

其他价值

  • 数据集(NCBI Bioproject PRJNA1119563)为后续研究提供资源。
  • 技术流程开源(GitHub: fibertools-rs, fiberseq-fire),推动三维基因组学发展。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com