Nucleic Acids Research刊发董波教授团队和王师教授团队合作的进化发育组学数据库文章

发布者:白璐发布时间:2022-11-03浏览次数:620

      2022112日,生命学院董波教授团队和王师教授团队联合在国际分子生物学领域顶级期刊Nucleic Acids Research在线发表 “EDomics: a comprehensive and comparative multi-omics database for animal evo-devo "(http://edomics.qnlm.ac),标志着国际上首个横跨整个动物界主要进化节点类群的发育进化相关多组学数据库和综合分析平台的成功建立和正式启用。

进化发育生物学(EvoDevo)是近年来国际上迅速崛起的新兴前沿交叉学科,旨在通过研究生物界高度多样化的发育过程,从而深刻归纳阐释发育过程背后隐藏的进化驱动机制和规律,以解答被Science杂志评为125个最具挑战性的科学难题之一的生物多样性决定机制问题。在过去的几十年里,利用经典模式生物(如黑腹果蝇、秀丽隐杆线虫、斑马鱼和小鼠)所开展的广泛研究给我们带来了生物学领域诸多重大发现和突破,奠定了目前遗传、发育和进化等领域的基本知识构架体系。然而,为数甚少的模式动物无法涵盖动物界高度多样化发育过程的全部信息,更无法提供对整个动物界发育进化过程的全景式解读和归纳。为填补这一极大的知识空白,利用具有关键系统发育位置和全谱系覆盖的新兴模式生物来描述整个生命树的发育进化,对驱动进化发育学领域的跨越式发展具有极为重要科学价值和意义。高通量测序技术的革命性突破及各类组学技术广泛应用,为生命科学领域带来前所未有的发展契机。基因组学、转录组学以及单细胞技术加速了许多传统的非模式生物转变成新兴的模式生物(如栉水母、丝盘虫、玻璃海鞘、侏儒蛤等)。尽管近些年非经典模式动物类群已积累了海量的多组学资源,并仍以史无前例的规模快速增长,但对这些储存分散的组学资源进行整合和综合分析仍是目前国际上动物进化和发育研究领域共同面临的重大挑战,迫切需要系统建立面向整个动物界的进化发育综合组学数据库和相应的分析工具和平台。

为实现这一目标,研究团队收集整合了横跨整个动物界的传统模式生物和新兴模式生物大量的基因组、转录组、单细胞和空间转录组数据资源,建立了统一标准,对多物种海量数据进行了归类处理,打通了跨物种多组学数据比较分析瓶颈技术难题,构建了国际首个动物进化发育多组学综合数据库平台(EDomics, http://edomics.qnlm.ac)。EDomics 数据库代表了迄今最全面和综合的发育进化多组学资源,囊括整个动物界主要类群的代表性物种,包括来自21个主要动物门类的40个高质量基因组和 1010 bulk转录组,以及68个单细胞转录组(涵盖来自12个广泛研究物种的429种细胞类型)。所包含的物种涵盖了主要的发育特性和进化节点,包括胚层的出现和分化、辐射对称和两侧对称的形成、原口动物到后口动物的过渡、水生到陆生以及无脊椎动物到脊椎动物的转变等(图1)。

1 EDomics囊括动物界主要进化节点类群及其多组学数据概览


EDomics 数据库不仅提供了高质量的多组学信息(包括基因组组装、基因组注释、基因家族聚类、线粒体基因组、各个发育阶段与成体组织/器官的基因表达谱和基因共表达网络),以及多维度的单细胞组学信息(如细胞聚类、标记基因、基因表达和空间信息等),同时也提供了强大的生物信息学工具。通过这些工具可以探究和比较分析不同动物类群之间的进化信息(如基因家族扩张/收缩、核心和可变基因组、基因组宏观共线性和发育转录组相似性分析等)。此外,利用数据库提供的定制化工具可高效开展跨物种组学数据分析和细胞谱系追踪(图2)。

2 EDomics数据库的六大功能模块实现了多组学数据和跨物种整合分析


EDomics数据库能够对整个动物界的基因组学和转录组学信息进行系统的进化发育维度展示,并提供极具价值、独特的平台来描述发育过程的主要转变和生物进化中的创新性变化。EDomics的建立将为国际动物进化和发育学界提供一个物种覆盖度最广、组学资源最丰富、分析功能最全面的开放获取数据库平台,实现对迅猛增长的evo-devo海量组学资源的系统整合和深度分析,以助推生命科学领域的创新发现和重大突破,最终描绘出整个生命之树的发展演变的全貌。


      以上研究成果的发表为国际动物进化发育领域提供了重要资源平台。文章评审期间,国际同行给予了很高的评价:“作者展示了一个动物进化发育领域综合的多组学数据库,令人印象非常深刻”(“The authors presented an integrative multi-omics database EDomics for animal evo-devo, which is very impressive.”);“这为整个进化发育生物学领域提供了非常有用的工具,特别是对单细胞和空间转录组数据的整合”(“These might be very useful tool for future studies in EvoDevo field especially recently published data of scRNA-seq and also spatial expression map.”)。这一成果是方宗熙萨斯中心团队在发布国际首个软体动物综合基因组数据库(MolluscDB: an integrated functional and evolutionary genomics database for the hyper-diverse animal phylum Molluscahttp://mgbase.qnlm.ac, Nucleic Acids Research 2021】)之后的又一重要突破,进一步彰显了中国海洋大学方宗熙萨斯中心在进化发育生物学领域的国际学术影响力。

      方宗熙萨斯中心董波教授、王师教授、李语丽副教授为论文的共同通讯作者,隗健凯博士、硕士生刘鹏辉、博士生刘福云为论文共同第一作者,中心其它成员参与了本项目研究开发工作。以上工作得到了国家重点研发计划、海洋科学与技术试点国家实验室重大项目、国家自然科学基金、山东省重点研发计划、山东省泰山学者等项目经费资助。该项工作同时获得了青岛海洋科学与技术试点国家实验室高性能科学计算与系统仿真平台的大力支持。


文章链接:

Jiankai Wei, Penghui Liu, Fuyun Liu, An Jiang, Jinghan Qiao, Zhongqi Pu, Bingrou Wang, Jin Zhang, Dongning Jia, Yuli Li*, Shi Wang* and Bo Dong*. EDomics: a comprehensive and comparative multi-omics database for animal evo-devo. Nucleic Acids Research. 2022.  https://doi.org/10.1093/nar/gkac944