当前位置: 首页 > 文章 > 基于蜜蜂球囊菌纳米孔测序数据的基因非翻译区延长、SSR位点发掘及未注释基因和转录本鉴定 昆虫学报 2020 (11) 1345-1357
Position: Home > Articles > 基于蜜蜂球囊菌纳米孔测序数据的基因非翻译区延长、SSR位点发掘及未注释基因和转录本鉴定 Acta Entomologica Sinica 2020 (11) 1345-1357

基于蜜蜂球囊菌纳米孔测序数据的基因非翻译区延长、SSR位点发掘及未注释基因和转录本鉴定

作  者:
杜宇;付中民;祝智威;王杰;冯睿蓉;王秀娜;蒋海宾;范元婵;范小雪;熊翠玲;郑燕珍;徐国钧;陈大福;郭睿
单  位:
福建农林大学生命科学学院;福建农林大学动物科学学院(蜂学学院)
关键词:
蜜蜂球囊菌;长读段测序技术;全长转录组;基因组;蜜蜂;白垩病;
摘  要:
【目的】利用已获得的纳米孔长读段测序数据完善现有的蜜蜂球囊菌Ascosphaera apis参考基因组注释信息,并对未注释的新基因和新转录本进行鉴定和功能注释。【方法】基于已获得的纳米孔长读段测序数据,采用gffcompare软件将蜜蜂球囊菌全长转录本与参考基因组注释的转录本进行比较,进而对参考基因组注释基因的非翻译区(untranslated region, UTR)进行延长。利用TransDecoder软件对蜜蜂球囊菌基因的开放阅读框(open reading frame, ORF)及相应的氨基酸序列进行预测。通过MISA软件发掘长度在500 bp以上的全长转录本的SSR位点。通过Blast工具将鉴定到的新基因和新转录本比对Nr, KOG, eggNOG, Swiss-Prot, Pfam, GO和KEGG数据库进行功能注释。【结果】共对蜜蜂球囊菌的9 481个基因进行了UTR延长,其中5′UTR和3′UTR延长的基因分别有4 744和4 737个。共预测出10 492个完整ORF,其中编码长度分布在0~100和100~200个氨基酸的ORF最多,分别占ORF总数的38.96%和36.90%。共鉴定到5 286个SSR,其中单核苷酸重复、二核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复和六核苷酸重复的SSR分别为1 870, 826, 2 398, 138, 43和11个。共鉴定到1 558个新基因,其中有1 556, 731, 330, 592, 1 177, 709和589个新基因可分别被注释到Nr, Swiss-Prot, Pfam, KOG, eggNOG, GO和KEGG数据库。此外,还鉴定到14 403条新转录本,其中有14 376, 8 524, 7 276, 7 405, 12 035, 7 891和6 855条新转录本可分别被注释到上述7个数据库。【结论】本研究利用已获得的纳米孔长读段测序数据对蜜蜂球囊菌的完整ORF进行了预测,对参考基因组的已注释基因进行了UTR延长,对未注释的SSR位点进行了发掘,此外还鉴定到大量未注释的新基因和新转录本,并对它们进行了功能注释。研究结果较好地完善了现有的蜜蜂球囊菌的基因组注释,为其组学和分子生物学研究的深入开展提供了基础。

相似文章

计量
文章访问数: 17
HTML全文浏览量: 0
PDF下载量: 0

所属期刊

推荐期刊