推荐几个常用的通路数据库
共 2902字,需浏览 6分钟
·
2021-03-07 17:53
生物通路数据库简介
什么是生物通路?
生物通路是细胞内分子之间的一系列相互作用,导致细胞内的某种产物或改变。这种通路可以触发新的分子的组装,比如脂肪或蛋白质。通路也可以开启或关闭基因,或者刺激细胞移动。一些最常见的生物通路涉及到新陈代谢、基因表达的调节和信号的传递。通路在基因组学的高级研究中起着关键作用。
通路数据库
通路信息可通过大量数据库获得,从专业策展人创建的高质量数据库到海量数据库,涵盖了通过自然语言处理和摘要文本挖掘创建的大量假定通路。由于大小、质量和/或属性的不同,有必要为用户的目的使用正确的数据库,无论它是用于商业还是公共使用。
主要通路数据库
通路数据库正在世界各地创建。每个数据库都强烈地反映了其构建者的意图和目的。有详细的代谢通路数据库,而其他数据库有详细的信号通路。大多数数据库是由阅读论文和提取通路信息的管理员创建的,这些信息将与数据库中的通路图一起组织起来。还有一些是使用自然语言处理和文本挖掘技术创建的,这些技术从论文中提取各种生物关系,比如基因调节关系,并将它们组织到数据库中。
KEGG
KEGG(Kyoto Encyclopedia of Genes and Genomes)是由京都大学生物信息学中心和东京大学人类基因组中心共同开发的一系列数据库。正如名字百科全书所暗示的,数据库包括系统理解生物学所必需的信息,如基因组序列和化学信息。KEGG的“通路”部分主要包括代谢通路。对于非商业用途,许可证是免费的,而对于商业用途,许可证由path Solutions Inc.出售。
KEGG的独特之处在于其对酵母,小鼠和人类代谢通路的关注和覆盖。目前,细胞周期和凋亡的信号通路正在扩展。阅读和总结相关文献的专业人士(策展人)创造了新的通路。数据库以KEGGML的格式存储。由于通路随后显示为GIF文件,用户无法轻松编辑通路信息。
BioCyc
BioCyc是SRI国际提供的通路数据库。
该数据库最初由SRI国际生物信息学研究小组建立,是一个专注于代谢通路的高质量数据库。与BioCyc相关的有EcoCyc、MetaCyc、HumanCyc数据库。许可证对学术和非营利组织都是免费的。人类和大肠杆菌是主要的生物体,还有其他各种生物体。EcoCyc主要是大肠杆菌代谢通路的数据库。这些反应以化学方程式的形式显示出来。EcoCyc也包含少量的信号通路。策展人从文献中提取了通路知识。使用专用格式描述通路。
此外,还列出了代谢通路上游的基因调控信息。换句话说,代谢通路与基因编码酶及其调节因子之间存在联系。通路图显示在细节级别上是分开的。在最详细的层面上,代谢产物以化学方程式的形式显示出来。
Reactome
Reactome是一个包含细胞代谢和信号通路的通路数据库。冷泉港实验室(Cold Spring Harbor Laboratory,)、欧洲生物信息学研究所(EuropeanBioinformatics Institute)和基因本体联合会(Gene Ontology Consortium)是该项目的主要开发者。虽然人类是被分类的主要生物,但它有22种其他物种的数据,比如老鼠(mouse)和大鼠(rat)。Reactome的通路和反应可以观看,但不能通过网页浏览器编辑。虽然存储格式是专有的,但大量的通路可以以多种格式获得。
WikiPathways
WikiPathways是一个致力于贡献和维护生物通路内容的社区资源。任何维基通路的注册用户都可以贡献,任何人都可以成为注册用户。贡献是由一组管理员监控的,但是大部分的同行评审、编辑管理和维护是用户社区的责任。WikiPathways是使用MediaWiki软件,一个自定义的图形通路编辑工具(PathVisio)和涵盖主要基因、蛋白质和代谢物系统的BridgeDb数据库构建的。
商业通路数据库
Ingenuity Pathways Knowledge Base
Ingenuity Pathways Knowledge Base (IPKB)是Ingenuity Systems Inc创建的通路数据库。所有的许可,包括学术许可和非营利性许可,都需要付费。该数据库包括基因调控和信号通路。策展人从这个数据库的文献中提取知识,该数据库目前包含人类、小鼠和大鼠的遗传信息。
ResNet
ResNet是由Ariadne基因组公司创建的pathway数据库。学术和商业执照都需要付费。ResNet的通路主要包括基因调控通路和信号转导通路。与其他数据库不同,ResNet是通过计算机分析构建的。换句话说,这些通路和网络是通过对相关文献进行自然语言处理而形成的。MedScan用于这个自然语言处理过程。数据库主要是由PubMed中的摘要构建的,但也有一些条目使用了全文。此外,还有少量由策展人创作的作品。由MedScan创建的通路数据可以通过查看工具pathway Studio查看。与其他数据库类似,MedScan使用自己的专有格式。
Meta-datadatabases
Meta-data数据库实现了对各种数据库中所包含的知识的整合。PathGuide是一个交互和通路相关资源的综合目录,目前在它的Meta-数据库中列出了超过702个资源。PathwayCommons和consensus suspathdb是存放集成的生物通路数据的数据库的例子。特别是前者,从不同的供应商收集数据,并以标准化的格式表示itin。这些Meta-data数据库特别适合分析合并通路信息。
生物数据库的局限性
虽然生物数据库对数据组织和存储至关重要,但它带来的挑战是多方面的。首先,数据库集成存在本体层次上的不一致性;因此,非标准化的命名法需要一种变通方法,这就需要使用映射。另一个主要问题是,数据可能是不完整的,模棱两可的,包含错误,冗余或不一致的文献。随着新知识的到来,可能还需要定期更新。专用数据库的问题包括通路数据库中的通路图,通常在本质上是静态的,只代表生物学的一个快照。重要的是,在某种程度上评估和考虑这种可变性,以便这些数据库的最终用户能够从它们的实用性中获益。
结论
尽管通路数据库很多,但即使是理想的统一版本也远远不够完善。大多数数据库提供者都将重点放在特定类型的生物过程上,反映出特定群体的研究兴趣和专业知识。数据库的内容,质量和完整性差异很大。此外,资源的缺乏限制了大多数数据库提供者提供最新通路知识的能力,因为要消化的科学文献非常多并且不断积累。当前,通路数据库中存储的信息仍落后于科学文章中介绍的知识。把它们综合起来的方法似乎是解决问题的直接方法。然而,它受到诸如异构数据模型和缺乏标准化数据访问方法之类的问题的阻碍。已经开发了各种数据交换标准来辅助通路信息的存储,组织和交换。但是,它们仍处于早期开发阶段。