牡丹花期调控遗传机制的全基因组关联研究
一、 研究团队、发表信息及领域
本研究由河南科技大学农学院/牡丹学院、洛阳市农林科学院、河南科技大学林学院、美国宾夕法尼亚州立大学、北京林业大学等机构的研究人员共同完成。通讯作者为河南科技大学的侯小改教授。论文于2022年7月27日收稿,2022年11月21日接受,并于2022年12月2日在线发表,最终于2023年2月10日校正付印。研究成果发表在《Horticulture Research》期刊2023年第10卷上,文章编号为uhac263。
本研究属于园艺植物分子生物学与遗传育种领域,具体聚焦于木本观赏植物开花时间的遗传调控机制研究。
二、 研究背景与目的
牡丹是中国的传统名花,享有“花王”之美誉,其花朵硕大、花色丰富、花香馥郁,具有极高的观赏价值和经济价值。然而,牡丹自然花期较短且集中,单朵花期仅3-5天,群体花期约10-15天,这一特性极大地限制了其在园林景观、切花生产及旅游产业中的应用与发展。尽管牡丹品种繁多,但大多数属于中花品种,早花和晚花品种比例较小。
目前,延长或调控花期的主要手段是杂交育种,但牡丹育种周期长、性状分离难以控制,进程缓慢。随着分子生物学技术的发展,对开花调控机制的研究已成为培育花期多样化品种的关键。在拟南芥等模式植物中,开花调控网络已被广泛研究,涉及光周期、春化、赤霉素、自主、衰老等多条途径,并由开花位点C (FLC)、开花位点T (FT)、CONSTANS (CO) 等一系列关键基因调控。然而,对于牡丹这类基因组复杂、研究起步较晚的多年生木本植物,其开花调控的分子机制尚不清楚。
全基因组关联分析 (Genome-Wide Association Study, GWAS) 是一种利用全基因组范围内的单核苷酸多态性 (Single-Nucleotide Polymorphisms, SNPs) 作为分子标记,来发现与复杂性状相关联的遗传变异的新型研究方法。随着牡丹首个基因组草图的发布,使得利用GWAS等手段深入研究牡丹复杂性状的遗传基础成为可能。
因此,本研究旨在通过大规模的表型精准鉴定,结合基于简化基因组测序 (Genotyping By Sequencing, GBS) 技术的高通量SNP分型,对牡丹的23个开花物候性状和4个花部农艺性状进行GWAS分析。研究的目标是:1) 揭示牡丹开花时间的遗传结构;2) 鉴定与花期性状显著关联的SNP位点和候选基因;3) 验证关键候选基因在花期调控中的功能;4) 为牡丹花期分子育种提供理论依据和分子标记资源。
三、 详细研究流程与方法
本研究流程系统而复杂,主要分为以下几个关键步骤:
1. 研究材料与表型精准鉴定 * 研究对象: 研究在河南科技大学牡丹种质资源圃进行,材料为596个牡丹观赏品种。为确保GWAS分析的准确性,避免群体结构造成的假阳性关联,最终从中筛选出451个品种构成关联分析群体。这些品种涵盖了极早花(4个)、早花(121个)、中花(280个)、晚花(44个)和极晚花(2个)五种类型,具有丰富的表型多样性。 * 表型观测: 在2019、2020、2021连续三年间,对开花物候进行了精细观测。观测记录了从花芽膨大到花瓣衰败的完整生殖生长过程,定义了11个关键物候期:显色期、破绽期、初开期、半开期、盛开期、始衰期、衰败期、盛花初期、盛花末期、衰败初期、衰败末期。针对每个物候期,记录了其发生时间点和持续时间,共计23个开花物候性状。此外,还测量了单株花数、花高、花径、花梗长度等4个花部农艺性状,以及株高、冠幅等植物学性状。 * 数据处理: 对观测数据进行描述性统计、相关性分析、主成分分析等,以评估性状的变异程度、相互关系和群体结构。结果表明,开花物候性状在群体内变异丰富,且时间相关性状与持续时间相关性状内部高度相关,但两者之间存在负相关关系,这为后续关联分析提供了清晰的表型基础。
2. 群体基因分型与SNP挖掘 * DNA提取与测序: 从451个品种的盛开期花瓣中提取基因组DNA。利用GBS技术构建测序文库,在Illumina HiSeq平台上进行PE150测序。 * 数据比对与变异检测: 共获得约1321.5 GB的洁净测序数据,平均每个样本2.9 GB。使用BWA软件将测序 reads 比对到牡丹参考基因组上,平均比对成功率达95.84%,平均测序深度为9.87倍。随后使用GATK软件进行SNP calling,初步获得超过4500万个SNP位点。 * SNP过滤: 对原始SNP进行严格过滤(深度≥4×,缺失率≤0.1,次要等位基因频率≥0.05),最终获得107,050个高质量SNP用于后续分析。这些SNP中,91.19%位于基因间区,5.72%位于内含子区,671个位于外显子区(其中18个为可能导致蛋白质功能丧失的终止密码子获得/缺失突变)。编码区SNP中,同义突变和非同义突变各占约一半。全基因组转换/颠换比为2.076。
3. 群体遗传结构分析 * 为控制群体结构对关联分析的影响,利用107,050个高质量SNP对451个牡丹品种进行了群体结构分析。 * 分析方法: 使用STRUCTURE软件评估个体的祖先成分和混合比例;基于遗传距离构建邻接系统发育树;利用GCTA软件进行主成分分析。 * 分析结果: 当K=8时,群体结构呈现高度混合状态。系统发育树与结构分析结果基本一致。PCA分析显示,不同花期类型的品种未形成明显的分层结构,表明群体遗传背景复杂但未严重分层,适合进行GWAS分析。
4. 全基因组关联分析 * 分析模型: 使用GEMMA软件,采用混合线性模型进行GWAS分析。该模型将群体结构作为固定效应,将个体亲缘关系矩阵作为随机效应,能有效控制假阳性。 * 显著性阈值: 采用Bonferroni校正确定显著性阈值(P < 9.34e-04)。 * 分析内容: 分别对23个开花物候性状和4个花部农艺性状在三年间的表型数据与基因型数据进行关联分析。通过曼哈顿图和QQ图可视化关联结果,并筛选显著关联的SNP位点。 * 候选基因注释: 将显著关联的SNP比对到参考基因组注释文件,定位其所在的或邻近的基因,作为候选基因。
5. 候选基因功能验证与表达分析 * 生物信息学分析: 对候选基因进行基因本体论和KEGG通路富集分析,推测其可能参与的生物学过程和代谢通路。 * 转录组测序验证: 选取具有显著花期表型差异的三个代表性品种(早花突变体、凤丹白、莲鹤),在其四个关键花发育时期进行RNA-seq测序,验证候选基因在花期调控过程中的差异表达模式。 * 实时定量PCR验证: 随机筛选部分差异表达基因,利用qRT-PCR在更精细的七个花发育时期验证其表达模式,并与RNA-seq结果相互印证。 * 瞬时过表达功能验证: 针对一个与FY基因同源的关键候选基因PoFY,构建了其过表达载体,并利用农杆菌介导的瞬时转化技术,在牡丹鲜切花、花瓣及花瓣圆片上进行了功能验证。通过比较过表达组与空载体对照组在开花进程、花朵萎蔫脱水过程中的表型差异(如开花时间、花期持续时间、花瓣失水率、复水恢复能力等),并结合qRT-PCR检测基因表达量,来评估PoFY基因的功能。
四、 主要研究结果
1. 表型多样性结果: 连续三年的观测表明,牡丹花期主要集中在3月下旬至4月。不同品种间以及不同年份间,各物候期的发生时间和持续时间均存在极显著差异。所有观测性状的变异系数在9.85%至48.37%之间,平均为24.91%,其中花期持续时间相关性状的变异(平均CV 35.68%)远大于发生时间相关性状(平均CV 15.28%)。相关性分析显示,11个花期时间性状之间以及11个花期持续时间性状之间均呈高度正相关,但花期总持续时间与大多数花期发生时间性状呈显著负相关。这为关联分析定位不同方面的调控位点提供了可能。
2. GWAS关联分析结果: * 总体关联: 在三年间,共检测到3816个与27个性状显著关联的SNP,这些SNP注释到1047个候选基因。其中,有176个基因在至少两个年份中被重复检测到与同一性状关联。 * 花期性状关联: 针对23个花期性状,三年共检测到2446个显著关联SNP,注释到82个在至少两年中重复出现的基因。这些基因中存在一些“多效性”位点,例如,基因psu.g.00032476、psu.g.00027564和psu.g.00012770与全部11个花期时间性状均显著关联;基因psu.g.00011319、psu.g.00026344等与9个花期持续时间性状显著关联。这暗示这些基因可能是调控牡丹开花进程的核心枢纽基因。 * 关键候选基因的发现: 研究锁定了一批在多个年份、多个性状中稳定关联的SNP及其对应的候选基因。其中,位于psu.g.00016433上的SNP 059892f:42007与盛花初期持续时间显著关联。该基因与拟南芥的FY基因高度同源。基因型-表型关联分析显示,携带GG纯合基因型的个体,其盛花初期持续时间显著长于GA杂合基因型的个体。该位点还与花高、花径等性状显著关联。
3. 候选基因功能验证结果: * PoFY基因的克隆与表达分析: 克隆了牡丹的PoFY基因,其开放阅读框长1629 bp。表达谱分析显示,PoFY在早花突变体、凤丹白和莲鹤中的表达模式存在差异,在开花过程中呈现动态变化,提示其参与花期调控。 * PoFY瞬时过表达功能验证: 在牡丹鲜切花中瞬时过表达PoFY,结果显示:过表达植株比对照提前约7小时进入盛花期,且从盛开到全部花瓣脱落的总时间延长了约8.75小时。在脱水-复水实验中,过表达PoFY的花瓣表现出更强的持水能力和复水恢复能力。这些结果直接证明PoFY具有促进开花进程、同时延缓花朵衰败的双重功能,可能通过调节水分代谢或相关激素信号通路来影响花期。 * 其他核心候选基因: 通过整合GWAS和转录组数据,筛选出另外5个在花期调控中可能起关键作用的候选基因(psu.g.00006813、psu.g.00010910、psu.g.00015854、psu.g.00019234、psu.g.00027564)。它们的拟南芥同源基因分别参与光信号调控、维持营养生长、ABA信号与干旱响应、线粒体外膜孔道形成以及花粉管感知与停滞等过程。表达分析表明,这些基因在早花和晚花品种中的表达水平存在差异。基因型-表型关联分析进一步证实了这些位点不同等位基因对花期性状的显著影响。
4. 花部农艺性状关联结果: 对单株花数、花高、花径、花梗长度的GWAS分析,也鉴定出一批显著关联的SNP和候选基因。例如,与单株花数关联的基因涉及组蛋白、糖代谢等;与花高关联的基因与漆酶家族、氨基酸代谢相关;与花径关联的基因可能参与次生代谢调控。
5. 等位基因累加效应: 研究分析了7个关键花期SNP位点的“增效等位基因”数量对表型的影响。发现花期总持续时间、单株花数、花径等性状与个体携带的增效等位基因数量之间存在显著的正线性相关关系。这为通过分子标记辅助选择,聚合多个有利等位基因以定向改良花期和花部性状提供了直接依据。
五、 研究结论与价值
本研究成功地对牡丹开花物候这一复杂数量性状进行了大规模、高通量的GWAS分析,系统揭示了其遗传调控网络。
科学价值: 1. 首次应用: 这是首次在牡丹中成功开展大规模、基于GBS-GWAS的开花性状遗传解析研究,证明了该方法在基因组庞大复杂的木本观赏植物中的有效性和可行性。 2. 基因发掘: 鉴定出1047个与花期和花部性状相关的候选基因,并从中筛选出包括PoFY在内的6个在多个年份和性状中稳定关联的核心候选基因,极大地扩充了对牡丹花期调控分子机制的认识。 3. 机制揭示: 功能验证表明PoFY基因能同时促进开花启动和延缓花朵衰老,为理解牡丹花期调控提供了新的基因资源和作用视角。其他候选基因的富集分析提示,激素信号(如ABA)、碳水化合物代谢、环境感知等通路在牡丹花期调控中可能发挥重要作用。 4. 理论拓展: 研究结果拓展了人们对多年生木本植物开花时间控制机制的理解,为比较基因组学和开花调控网络的进化研究提供了宝贵数据。
应用价值: 1. 分子标记开发: 鉴定出的与花期紧密相关的SNP标记,可直接用于牡丹分子标记辅助选择育种,实现早花、晚花、长花期等性状的精准、高效选育,缩短育种周期。 2. 育种实践指导: 增效等位基因累加效应的证实,为通过杂交聚合多个有利等位基因、培育具有理想花期性状的新品种提供了明确的育种策略。 3. 关键基因资源: PoFY等关键候选基因可作为基因工程改良的靶点,未来通过转基因或基因编辑技术,有望实现对牡丹花期的定向调控。
六、 研究亮点
七、 其他有价值内容
本研究构建的包含451个品种基因型和多年多点多性状表型的数据库,本身就是一个宝贵的资源库,可用于牡丹种质资源评价、遗传多样性分析、其他重要性状的关联分析等后续研究。论文中详尽的材料与方法描述,特别是牡丹表型观测标准、GBS建库分析流程、瞬时表达体系建立等,对同行具有很高的参考价值。