分享自:

d-genies:以交互、高效和简单的方式绘制大基因组点图

期刊:PeerJDOI:10.7717/peerj.4958

这篇文档属于类型a,即报告了一项原创研究。以下是针对该研究的学术报告:

主要作者与机构

该研究由Floréal Cabanettes和Christophe Klopp共同完成,他们来自法国图卢兹的Genotoul生物信息学平台、应用数学与信息学研究所(INRA)。研究论文于2018年6月4日发表在《PeerJ》期刊上,题目为“d-genies: dot plot large genomes in an interactive, efficient and simple way”。

学术背景

点图(dot plot)是一种广泛用于快速比较序列集的工具,能够以直观的方式展示序列之间的相似性,突出重复、断裂和倒位等特征。随着基因组测序技术的快速发展,基因组组装数据的数量急剧增加,研究人员需要一种简单且高效的工具来生成大规模基因组的点图。然而,现有的点图工具在处理大规模基因组时存在输入序列大小的限制,且交互性较差。因此,Cabanettes和Klopp开发了d-genies,旨在提供一种交互式、高效且易于使用的工具,用于生成大规模基因组的点图。

研究流程

d-genies的开发流程主要包括以下几个步骤:

  1. 工具选择与优化
    d-genies基于minimap2软件包进行基因组比对。minimap2是一种能够快速比对大规模低相似度多序列文件的核酸序列比对工具。为了降低内存消耗和处理时间,d-genies将大序列(如染色体)分割为10兆碱基(Mega-base)的片段进行比对。

  2. 用户界面设计
    d-genies提供了基于JavaScript的交互式用户界面,使用d3.js库进行图形渲染。为了缩短绘制时间,仅绘制最大的10万个比对结果。用户可以通过网页浏览器访问d-genies的独立应用程序或网页应用程序,进行序列上传、比对和点图生成。

  3. 功能实现
    d-genies支持两种模式:新比对模式(new alignment mode)和绘图比对模式(plot alignment mode)。在新比对模式下,用户可以上传本地或远程的参考序列和查询序列文件,系统会自动进行比对并生成点图。在绘图比对模式下,用户需要提供两个FASTA文件和一个比对文件(PAF或MAF格式),系统仅生成图形。

  4. 结果展示与导出
    生成的点图以彩色线条展示比对结果,颜色对应不同的相似度区间(小于25%、25%-50%、50%-75%、大于75%)。用户可以通过缩放、排序、过滤等功能优化图形展示,并下载PNG或SVG格式的图像文件、比对文件以及重新排序的查询序列文件。

  5. 工具扩展与安装
    d-genies支持添加新的比对工具和比对文件格式。用户可以通过编辑配置文件(tools.yaml)和添加解析函数来扩展功能。d-genies可以在Unix或Windows系统上作为独立应用程序安装,也可以在Unix系统上作为网页服务器运行。

主要结果

  1. 处理时间与内存消耗
    d-genies在处理时间上显著优于现有的点图工具(如Gepard和R2cat)。例如,在比较人类与黑猩猩基因组时,d-genies仅需1小时10分钟,而Gepard和R2cat分别需要数小时甚至无法完成。此外,d-genies通过分块比对策略,将人类与黑猩猩基因组比对的内存消耗从81GB降低到36GB。

  2. 交互性与用户体验
    d-genies提供了丰富的交互功能,包括序列排序、缩放、过滤和颜色模式切换等,极大地提升了用户体验。用户还可以通过点击图形区域或使用快捷键进行快速操作。

  3. 工具扩展性
    d-genies的扩展性使其能够支持多种比对工具和文件格式,用户可以根据需求自定义工具配置。

结论

d-genies代表了第三代点图工具,能够高效处理大规模基因组,并提供用户友好的交互界面。其基于minimap2的比对算法和分块比对策略显著提升了处理速度和内存效率。此外,d-genies的扩展性使其能够适应不同的研究需求,为基因组比较分析提供了强有力的工具支持。

研究亮点

  1. 高效性:d-genies在处理大规模基因组时,处理时间显著优于现有工具。
  2. 交互性:丰富的交互功能提升了用户体验,使点图分析更加直观和灵活。
  3. 扩展性:支持添加新的比对工具和文件格式,适应不同的研究需求。

其他有价值的内容

d-genies的开发得到了法国基因组国家基础设施(France Génomique National Infrastructure)的支持,其源代码和测试平台均公开,用户可以通过GitHub和网页门户进行访问和测试。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com