分享自:

植物胁迫本体的半自动化标准化方法

期刊:Proceedings of the 9th International Conference on Biological Ontology (ICBO 2018)

植物胁迫本体(OOPS):半自动化标准化方法学的学术报告

一、研究团队与发表信息
本研究由Austin Meier(Oregon State University)、Laurel Cooper(Oregon State University)、Justin Elser(Oregon State University)、Pankaj Jaiswal(Oregon State University)、Marie-Angélique Laporte(Bioversity, France)及Jorrit H. Poelen(独立研究者)合作完成,发表于2018年8月的ICBO 2018(International Conference on Biological Ontology)会议论文集。


二、学术背景与研究目标
科学领域与背景
植物胁迫研究是作物育种和植物病理学的核心领域。全球气候变化加剧了植物病害传播,传统育种方法难以快速整合抗性基因,而大量已有研究数据因缺乏标准化标注而无法复用。

研究动机
现有植物胁迫数据(如抗性基因、定量性状位点QTLs)分散且命名不统一,阻碍跨研究比较。例如,同一病原体在不同宿主中的基因响应机制可能相似,但缺乏标准化词汇难以关联分析。

目标
开发植物胁迫本体(Ontology of Plant Stress, OOPS),通过半自动化方法构建标准化词汇体系,整合生物与非生物胁迫分类,链接宿主-病原体-化学实体等知识库(如NCBI Taxonomy、ChEBI、Plant Ontology),支持语义化查询(如“某病原体在近缘宿主中是否触发同源基因表达?”)。


三、研究方法与流程
1. 本体顶层设计
- 分类框架:将植物胁迫分为生物胁迫(Biotic Stress)(如病害、草食性胁迫)和非生物胁迫(Abiotic Stress)(如营养缺乏/过量)。
- 手动定义顶层类:例如,非生物胁迫下分“过量(Excess)”和“缺乏(Deficiency)”子类,生物胁迫下分“病害过程(Disease Process)”和“草食性胁迫(Herbivory)”。

2. 自动化术语生成
- 设计模式(Design Patterns):采用Dead Simple OWL Design Patterns (DOS-DPs),通过表格化输入自动生成OWL本体术语。
- 非生物胁迫模式
- 过量模式:定义化学实体(如氮原子ChEBI:29352)在植物结构(如叶片PO:0009025)中的过量胁迫。
- 缺乏模式:类似逻辑,但标注为“减少量(decreased amount)”。
- 生物胁迫模式:基于宿主(NCBI Taxonomy)、病原体(NCBI Taxonomy)和感染部位(Plant Ontology)三元组定义病害。

3. 数据采集与处理
- 非生物胁迫术语:从Plant Trait Ontology (TO)提取现有胁迫性状,转换为OOPS术语。
- 生物胁迫术语
- 网络爬取:使用Samara工具(Scala开发)从American Phytopathological Society (APS)网站抓取病害名称、宿主和病原体信息。
- 术语映射:通过名称映射表(namemap.tsv)校正术语,链接至NCBI Taxonomy和Plant Ontology。
- 自动化流程:利用Jenkins实现持续集成,20分钟内完成数据更新并推送至Global Biotic Interactions (GloBI)平台。


四、主要研究成果
1. 本体构建成果
- 术语覆盖:初期纳入Plant Trait Ontology的全部非生物胁迫性状(如氮敏感TO:0000011、磷敏感TO:0000102),并通过APS爬取1,000+病害术语(如水稻白叶枯病)。
- 逻辑区分:通过宿主-病原体-部位三元组,区分同名但不同病原的病害(图2示例)。

2. 方法学创新
- 半自动化流程:通过表格输入和设计模式降低本体构建门槛,非专家可通过编辑表格贡献术语(如添加新病害)。
- 跨本体链接:整合ChEBI(化学实体)、NCBI Taxonomy(分类学)和Plant Ontology(植物结构),形成知识网络。

3. 应用潜力
- 语义查询:支持复杂查询(如“某QTL区间内基因在特定病原体下的表达模式”)。
- 农业工具开发:为农民、育种者提供数字化诊断支持,例如通过宿主筛选马铃薯相关病害。


五、结论与价值
科学价值
- 数据复用性:标准化标注使公共数据可跨研究复用,减少重复实验。
- 知识整合:通过本体关联不同领域(如病理学、遗传学、化学),推动交叉研究。

应用价值
- 加速育种:快速识别抗性基因来源,缩短育种周期。
- 环境友好:减少农药依赖,通过精准抗性育种降低环境污染。


六、研究亮点
1. 方法创新:首次将设计模式与网络爬取结合,实现植物胁迫本体的半自动化构建。
2. 跨领域整合:链接化学、分类学、解剖学本体,构建多维知识图谱。
3. 社区驱动:通过简化贡献流程(如表格编辑)促进专家参与,解决本体维护难题。

七、未来方向
- 社区协作:与CGIAR研究中心、APS合作,持续更新病害术语。
- 工具开发:推出公开表格编辑界面,支持GitHub版本控制。
- 扩展应用:将OOPS链接至Plant Trait Ontology,增强Planteome知识库的查询能力。

八、资助与资源
本研究受美国国家科学基金会(IOS:1340112)资助,代码开源于GitHub(https://github.com/planteome/ontology-of-plant-stress)。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com