太行山崖壁专精物种菊科太行菊属植物的适应性进化基因组学研究
一、 主要作者、机构及发表信息 本研究由山西师范大学的王怡凌(Yiling Wang)团队、西北大学的耿方东团队以及加拿大圣玛丽大学的Genlou Sun团队合作完成。研究论文“Genome sequencing and population genetics provide insights into local adaptation of Opisthopappus species on cliff environments of Taihang Mountains” 于2025年发表于国际学术期刊 *The Plant Journal*。
二、 研究背景与目的 本研究的科学领域为进化生物学和基因组学,聚焦于物种的“本地适应”(Local adaptation)这一核心议题。本地适应是指物种通过行为、生理和形态的改变,在其特定生境中获得更高的适应度。理解本地适应的遗传机制对于预测物种如何响应气候变化、维系种群稳定至关重要。
太行山脉拥有独特的崖壁地貌,形成了多样的微环境和选择压力,成为研究物种适应性进化的天然实验室。菊科太行菊属(*Opisthopappus*)是仅分布于太行山的多年生草本属,包含长裂太行菊(*O. longilobus*)和太行菊(*O. taihangensis*)两个物种,分别主要占据山脉的北段和南段,是典型的崖壁专精植物。前期研究表明二者在形态和生态位上存在分化,暗示了它们可能为适应不同局部崖壁环境而发生了适应性进化。
基于此,本研究提出核心假设:太行菊属物种在其进化历程中,为适应太行山异质性的崖壁环境而发生了局部分化与适应。研究设定了三个具体目标:1)解析太行菊基因组特征,探究其适应崖壁环境的潜在策略;2)阐明两个物种的进化历史(如种群动态、基因流)如何驱动其遗传分化;3)挖掘两个物种适应太行山崖壁环境的遗传基础(适应性基因)。
三、 详细工作流程 本研究采用了整合性的研究策略,结合了全基因组测序与群体基因组学分析,工作流程系统且深入。
步骤一:太行菊全基因组测序、组装与注释。 本研究的研究对象为太行菊(*O. taihangensis*)。首先,采集来自王莽岭(WML)种群的健康个体,利用CTAB法提取高质量基因组DNA和不同组织的总RNA。采用Illumina短读长测序平台和PacBio单分子实时(SMRT)长读长测序技术进行测序,并结合Hi-C技术进行染色体挂载。通过17-mer分析预估基因组大小和杂合度。使用Hifiasm等软件进行从头组装,并用NextPolish和Pilon进行纠错。利用BUSCO和CEGMA评估组装完整性,通过BWA比对评估序列一致性。随后,综合使用同源比对和从头预测方法鉴定重复序列和转座元件(Transposable Elements, TEs),并估算长末端重复反转录转座子(LTR retrotransposons)的插入时间。最后,整合从头预测、同源比对和RNA-seq辅助预测三种方法,对蛋白质编码基因进行预测,并利用Swiss-Prot、GO、NR等多个数据库进行功能注释。
步骤二:比较基因组学与进化分析。 将组装好的太行菊基因组与菊科其他10个物种(如向日葵、菊花、青蒿等)以及拟南芥(外群)的基因组进行比较。使用OrthoMCL鉴定基因家族,基于单拷贝基因家族构建系统发育树,利用PAML的MCMCTree估算物种分化时间,并通过CAFE软件分析基因家族的扩张与收缩。同时,运用密码子替换模型(branch-site model)检测太行菊谱系中受正选择(Positive selection)的基因,并通过富集分析探究其功能。此外,通过分析基因组内同源基因对的同义替换率(Ks)分布,检测全基因组复制(Whole-genome duplication, WGD)事件。
步骤三:群体样本采集与简化基因组测序。 研究从太行山全境采集了太行菊属两个物种共16个自然种群(每个种群10个个体)的160份样本。提取样本DNA后,采用双酶切限制性位点相关DNA测序技术进行简化基因组测序。测序得到的原始读段经过Trimmomatic质控后,使用BWA软件比对至太行菊参考基因组,通过GATK流程进行单核苷酸多态性(SNP)的检测与过滤,最终获得高质量的SNP数据集用于后续分析。
步骤四:群体遗传结构与历史分析。 利用步骤三获得的SNP数据,进行多维度分析:1)使用ADMIXTURE软件进行群体结构分析,确定最佳遗传聚类数(K值);2)使用MEGA构建最大似然系统发育树;3)进行主成分分析以可视化遗传分化;4)计算种群间的遗传分化指数(Fst)和遗传距离;5)分析连锁不平衡(Linkage disequilibrium, LD)的衰减情况。此外,使用SMC++软件估算两个物种历史有效种群大小(Ne)的动态变化。更为关键的是,利用fastsimcoal2软件构建了包含26种不同情景(涉及有无基因流、基因流发生时间等)的种群历史模型,通过AIC值筛选出最优模型,从而估算物种分化时间、历史种群大小变化及双向基因流强度。同时,使用Dsuite软件的ABBA-BABA检验和F4-ratio方法检测种群间具体的基因渗入事件。
步骤五:本地适应相关的环境关联分析。 为了鉴定与崖壁环境适应相关的遗传位点,研究团队首先从WorldClim等数据库获取了采样点的107个环境因子,通过主成分分析去除共线性后,最终筛选出8个关键环境变量(主要集中在降水、温度、太阳辐射和土地利用类型)。随后,采用三种互补的方法来识别与环境因子显著关联的适应性SNP:1)基于种群分化异常的Fst离群值检测(使用Fdist2);2)潜在因子混合模型(LFMM);3)空间关联方法(SAMBADA)。将至少被两种方法共同鉴定出的SNP视为高置信度的适应性位点。进而,提取这些SNP上下游100 kb区域内的基因,定义为“候选适应性基因”。此外,还利用冗余分析探讨了紫外(UV)辐射与转座元件衍生SNP之间的关联。
步骤六:关键适应性基因的功能验证。 从候选适应性基因中,特别关注了两个物种特异的、且与重要生物学过程相关的基因:一个是在长裂太行菊中特异的葡萄糖脱氢酶基因(EVM.TU.Chr4.10670),另一个是在太行菊中特异的锌依赖外肽酶基因(EVM.TU.Chr8.14389)。研究进行了深入的后续分析:1)绘制这两个基因所在区域的连锁不平衡区块图和单倍型网络图;2)分析它们在两个物种不同组织中的转录组表达谱;3)设计特异性引物,通过实时定量PCR(qrt-PCR)实验,在多个组织样本中验证这两个基因的表达模式差异。
四、 主要研究结果 1. 太行菊基因组特征揭示其适应性策略。 组装获得的高质量太行菊基因组大小约为3.01 Gb,具有高杂合度(1.37%)和高重复序列比例(82.70%),其中LTR反转录转座子占主导(68.76%)。比较基因组分析发现,太行菊基因组经历了大规模基因家族扩张(6107个),并检测到一次发生在约4731万年前(始新世)的全基因组复制事件。LTR的爆发性插入发生在约4万年前(更新世晚期),与当时的剧烈气候波动时期吻合。这些特征——巨大的基因组、丰富的重复序列(尤其是TEs)、WGD事件及近期活跃的LTR插入——共同构成了太行菊应对崖壁严峻环境(如贫瘠土壤、气候波动)的重要基因组适应策略。正选择分析鉴定出243个基因,主要富集于氧化还原、胚胎发育、开花调控等过程。
2. 两个物种的进化历史与有限的基因交流。 群体遗传分析清晰地将160个个体划分为对应于两个物种的遗传簇。太行菊和长裂太行菊之间存在较高的遗传分化(Fst=0.1585)。最优种群历史模型(模型13)显示,二者大约在1757万年前(中新世)从共同祖先分化,长裂太行菊为祖先种。分化后,两个物种的有效种群大小均有所扩张,但在约7万年前(更新世晚期)均经历了急剧下降。模型支持两个物种间存在持续但不对称的基因流,从太行菊流向长裂太行菊的基因流更强。ABBA-BABA检验进一步证实了种群间存在零星的基因渗入信号。这些结果表明,地形和气候变迁导致了物种分化与长期隔离,有限的基因流不足以抵消自然选择驱动的遗传分化,而晚更新世的种群瓶颈事件可能加强了正选择的作用。
3. 鉴定出调控崖壁环境适应的关键基因。 通过环境关联分析,共鉴定出798个候选适应性基因,其中207个属于扩张基因家族,8个同时受到正选择。这些基因主要参与响应水分胁迫、寒冷、UV辐射、DNA修复、花粉及种子发育等生物学过程。KEGG通路分析显著富集于“泛素-蛋白酶体途径”(Ubiquitin-mediated proteolysis)。该途径在调控种子大小中起关键作用,可能帮助太行菊属植物产生更适应崖壁扩散的小种子。尤为重要的是两个物种特异性基因:在长裂太行菊中特异的葡萄糖脱氢酶基因(EVM.TU.Chr4.10670),参与单萜类物质合成通路,在花中高表达,qrt-PCR验证其在长裂太行菊的花和其他组织中表达显著高于太行菊,这可能与其吸引传粉者或抗虫防御相关。在太行菊中特异的锌依赖外肽酶基因(EVM.TU.Chr8.14389),在芽和花中高表达,qrt-PCR证实其在太行菊各组织中的表达均显著高于长裂太行菊,该基因可能在种子形成和发育中起重要作用,帮助太行菊在恶劣环境中完成生殖。UV辐射的冗余分析表明,转座元件的变异与UV辐射显著相关,特别是最低月平均UV,提示UV辐射可能通过影响转座元件的活性来驱动遗传分化。
五、 研究结论与价值 本研究得出结论:太行菊属物种通过其独特的基因组进化特征(大基因组、WGD、丰富TEs)、受历史气候和地形塑造的种群动态(有限基因流、种群瓶颈),以及一套涉及胁迫响应、生长发育调控(特别是泛素-蛋白酶体途径)和物种特异性代谢(如单萜合成、蛋白酶活性)的遗传机制,成功实现了对太行山异质性崖壁环境的本地适应。
本研究的科学价值在于:1)首次在基因组层面系统揭示了崖壁专精植物的适应性进化机制,为理解极端生境下植物的生存策略提供了典范案例。2)整合了全基因组测序、比较基因组学、群体基因组学及环境关联分析,建立了从宏观进化历史到微观遗传基础的研究范式。3)鉴定出的适应性基因和通路(如响应UV和干旱的基因、泛素-蛋白酶体途径、物种特异性基因)为后续的功能验证研究提供了重要靶点。应用价值体现在:为珍稀崖壁植物的保护生物学研究(如评估遗传多样性、预测气候变化响应)提供了理论依据和数据资源,并为其他崖壁或极端环境生物的适应性进化研究奠定了基础。
六、 研究亮点 1. 研究对象独特:聚焦于具有明确生态位分化的同属姊妹种,且均为分布狭窄的崖壁特化植物,是研究本地适应的理想体系。 2. 研究策略系统:首次将太行菊染色体级别参考基因组、跨物种比较基因组、全分布区高密度群体遗传学及多环境因子关联分析有机结合,形成了一个从“基因组特征”到“进化历史”再到“适应基因”的完整证据链。 3. 发现新颖深刻:不仅揭示了基因组大小、重复序列、WGD等宏观特征在适应中的可能作用,还精细定位到物种特异性适应基因,并将环境选择压力(如UV辐射)与转座元件动态联系起来,提出了新的适应视角。 4. 技术方法前沿:综合利用了PacBio长读长、Hi-C、ddRAD-seq等前沿测序技术,并采用了fastsimcoal2进行复杂的种群历史建模,以及多种统计方法交叉验证环境关联信号,保证了结果的可靠性。
七、 其他有价值内容 研究还探讨了晚更新世气候剧变(0.07 mya)对两个物种有效种群规模的同步削弱作用,这可能是驱动它们经历强烈正选择、加速适应性进化的关键历史节点。此外,对“泛素-蛋白酶体途径”在种子大小调控中作用的强调,将植物发育生物学的基本通路与具体的生态适应(产生适于风媒或动物扩散的小种子)联系起来,体现了性状适应背后的保守分子机制。最后,作者指出了未来需要通过同质园实验、多组学联用等手段对候选基因功能进行进一步验证,为后续研究指明了方向。