类型a:这篇文档报告了一项原始研究。
主要作者和机构及发表信息
该研究的主要作者包括陈明建(Mingjian Chen)、李琳芳(Linfang Li)、王书安(Shu’an Wang)、王鹏(Peng Wang)和李亚(Ya Li),他们均来自中国科学院江苏省植物研究所的观赏植物研究中心。该研究于2024年2月5日发表在《PLOS ONE》期刊上。
学术背景
本研究属于植物分子生物学领域,重点探讨了铁线莲属植物中与开花调控相关的基因家族——MADS-box基因家族的功能与进化关系。铁线莲(Clematis courtoisii)是一种具有观赏价值的落叶木质藤本植物,其花朵大而美丽,是培育新品种的重要亲本材料。然而,由于缺乏参考基因组数据,关于铁线莲开花机制的关键基因研究相对较少。MADS-box基因家族是一类重要的转录因子家族,广泛参与植物的开花调控和花器官发育过程。基于此背景,本研究旨在通过全长转录组测序技术,系统筛选并分析铁线莲中与MADS-box基因家族相关的基因,并探索其保守结构域组成及进化关系,为后续研究铁线莲的生物功能、分子机制及相关功能基因提供基础数据。
研究流程
本研究分为多个步骤,具体如下:
样本采集与RNA提取
研究材料为3年生铁线莲(Clematis courtoisii Hand.-Mazz),种植于南京中山植物园的铁线莲苗圃中。实验采集了根、茎、叶和花四种组织样本,每种组织分别采样三次,并保存于-80°C以备后续实验。使用RNApure试剂盒提取总RNA,并通过OneDrop2000检测RNA纯度,Qubit4.0定量RNA浓度,Agilent 2100 Bioanalyzer测定RNA完整性。
全长转录组测序
使用HiScript III 1st Strand cDNA Synthesis Kit将mRNA逆转录为cDNA,随后进行PCR扩增、损伤修复和末端修复,连接SMRT接头并进行外切酶消化。最终构建的SMRT文库由Genepioneer Biotechnologies完成测序。原始数据已上传至NCBI Sequence Read Archive数据库,登录号为SUB13428639。
数据处理与校正
原始数据通过SMRT Link v5.0.0分析,获得subreads序列。通过单分子多序列读取校正subreads,生成环状一致性序列(CCS)。根据是否包含cDNA引物和poly(A)尾信号,识别全长非嵌合序列(FLNCs)。非冗余ROI序列被分为全长或非全长两类,并使用非全长序列对全长序列进行聚类和校正,最终获得共识读段。
基因功能注释
使用BLAST工具将unigenes与多个公共数据库(如NR、GO、COG、KOG、Swiss-Prot、KEGG和Pfam)进行比对,获取功能注释信息。默认参数设置为E-value<10^-5。
MADS-box基因鉴定
初步基于unigenes的注释信息筛选出与MADS-box转录因子相关的基因。随后,利用SMART数据库检测这些基因翻译蛋白序列中的保守MADS-box结构域,并通过HMMER软件的hmmscan功能搜索PF00319和PF01486结构域,成功鉴定出19个候选MADS基因。
进化树构建与保守结构域分析
将候选MADS-box基因翻译蛋白序列与拟南芥(Arabidopsis thaliana)、牡丹(Paeonia suffruticosa)、莲(Nelumbo nucifera)和葡萄(Vitis vinifera)中的MADS蛋白进行多序列比对,使用Clustal W2.1软件进行比对,并通过MEGA 11.0最大似然法构建进化树。此外,使用Batch CD-Search和MEME软件分析候选MADS-box基因翻译蛋白的保守结构域和基序。
主要结果
1. 全长转录组数据统计
本研究共获得12.38 Gb的subreads数据,包含9,476,585条subreads。经过IsoSeq校准后,获得了422,635条CCS读段、327,248条全长读段、95,359条非全长读段、300,171条FLNC读段和120,294条共识序列。最终去冗余后得到50,439条unigenes,总长度为78,967,817 bp,平均长度为1,390 bp,N50长度为1,869 bp,GC含量为44.36%。
功能注释结果
在50,439条unigenes中,有37,923条(75.18%)被成功注释。其中,1,936条unigenes在七个数据库中均被注释,12,516条unigenes未被注释。NR数据库注释结果显示,与铁线莲unigenes匹配最多的物种为莲(Nelumbo nucifera,19.06%)和葡萄(Vitis vinifera,8.36%)。KOG数据库注释表明,许多unigenes参与了生命活动的多种过程,如一般功能预测、翻译后修饰、信号转导机制等。
MADS-box基因鉴定与分类
共鉴定出50个与MADS-box转录因子相关的unigenes,进一步筛选后确定19个候选MADS基因。进化树分析显示,这19个基因可分为Type II MIKC*型(1个)和MIKCC型(18个),未检测到Type I型基因。MIKCC型基因可进一步分为STMADS11(4个)、DEF(1个)、GLO(2个)、AGL6(1个)、SQUA(2个)和TM3(8个)六个亚家族。
保守结构域分析
结构域分析显示,MADS-box结构域由基序1、3、5和6组成,K-box结构域由基序2和4组成。部分基因(如CCMADS05、07和17)表现出较完整的MADS-box和K-box结构域,而其他基因仅具有MADS-box结构域。
结论与意义
本研究通过全长转录组测序技术,首次系统鉴定了铁线莲中的MADS-box基因家族成员,并分析了其保守结构域组成和进化关系。研究结果为深入研究铁线莲的开花调控机制和花器官发育提供了重要数据支持。此外,本研究还展示了第三代测序技术在非模式植物研究中的优势,为未来相关研究提供了参考。
亮点
1. 首次在铁线莲中系统鉴定了19个MADS-box基因家族成员,并对其进行了详细分类。 2. 使用PacBio SMRT技术进行全长转录组测序,克服了第二代测序技术的局限性。 3. 发现了铁线莲中与花发育相关的关键基因(如CCMADS08和CCMADS15),为改良铁线莲花型和开花期提供了理论依据。
其他有价值内容
本研究强调了MADS-box基因家族在植物开花调控和花器官发育中的重要作用,并指出未来可通过分子生物学手段调控这些基因的表达,从而改良铁线莲的观赏特性。此外,研究还指出,复杂基因组结构和重复序列可能影响转录组测序的准确性,提示未来研究需结合基因组测序以提高数据质量。