2018年9月17日,《Horticulture Research》杂志在线发表了我课题组硕士研究生徐慧敏为第一作者,题为“PGD:Pineapple Genomics Database”的研究论文,重点介绍了张积森教授团队开发的菠萝基因组数据库。福建农林大学基因组与生物技术研究中心张积森教授和明瑞光教授,山东农业大学的杨龙副教授为共同通迅作者;此外,于青一教授、唐海宝教授、研究生石岩、华秀婷参与该研究。项目得到福建省重大科技专项(2016NZ0001)和福建新世纪人才项目的资助。
菠萝是单子叶植物,在进化上与禾本科植物近缘(包括玉米、高粱、水稻、小麦),在进化上菠萝比禾本科少了一次全基因组复制事件,是禾本科作物比较基因组分析最好的基因组,也是研究凤梨科和景天酸代谢光合作用植物很好的参考模型。张积森教授团队开发了菠萝基因组数据库(PGD,Pineapple Genomics Database)的在线平台,平台储存和整合菠萝基因组、转录组、功能注释以及分子标记以及比较基因组等数据。
数据库网址:http://pineapple.angiosperms.org/pineapple/html/index.html
数据采集与处理
主要来自公共发表的平台,由Ray Ming. et al测序与组装的菠萝F153参考基因组数据。基于该数据,我们对其进行了基因功能注释,分子标记注释,转录组分析,基因共表达分析,菠萝景天酸代谢途径相关基因以及比较基因组分析,并将分析结果进行过滤最终以交互式的方式在该数据库展示。数据库结构如下:
数据库功能
该数据库涵盖了基因功能注释、分子标记、比较基因组、基因表达量和基因共表达的搜索工具,还包括基因组可视化工具和在线序列比对工具,如图A是基因共表达信息查询,用户可通过输入目标基因的ID查询与其它基因的相关性系数,图B是基因组信息以及功能注释信息的查询,用户可通过输入基因ID/功能注释ID/基因蛋白注释关键词,查询目标基因的相关信息,比如其GO注释,KEGG注释结果,InterPro注释结果,以及序列信息,并且可通过JBrowse可视化;图C是基因表达信息,该数据库共收录了45个转录组样本信息,其中包括不同部位,叶片不同时间段,以及叶片不同片段的基因表达量信息均在该数据库可查询;图D是比较基因组查询界面,该数据库对菠萝与其它物种(水稻,葡萄,浮萍,芦笋,油棕,枣椰树,高粱和香蕉)进行了比较基因组分析,用户可通过选择比较的物种,查询菠萝与其它物种的基因共线性;图E和F分别是BLAST序列 比对工具和基因浏览器,PGD也包括了菠萝景天酸代谢的模块,可以了解其与其它高光合物种之间的进化关系。该数据库为菠萝基因组序列信息搭建了良好的平台。并且,该数据库包含了一系列的附加页面,以交互式的方式展示数据和批量下载数据。
本数据库的目标为:存储和管理菠萝生物数据,促进禾本科作物比较基因组分析,进而构建综合型菠萝基因组数据库。数据库将定期更新内容,以储和管理菠萝生物数据,促进禾本科作物比较基因组分析,进而构建综合型菠萝基因组数据库为目标,不断完善和丰富数据库的内容。
论文连接:https://www.nature.com/articles/s41438-018-0078-2#article-info