BioJava生物信息学基础库

联合创作 · 2023-10-01 17:32

BioJava – 开源的生物信息学基础库

生物信息学,从字面上理解,这是一门与生命科学和信息科学这两个当今热点领域都相关的学科。
那到底什么是生物信息学?在这里,我只能很遗憾地告诉大家,对于这样一门新兴的、而且正在不断发展和变化中的学科,我很难给出一个精确的定义。

广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释。这一定义包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。

具 体地说,生物信息学是把基因组 DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和 RNA基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在 DNA序列中的遗传语言规律;在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规 律。

信息技术的发展和应用使得几乎所有的人受益,研究DNA、RNA和蛋白质的分子生物学家也不例外。很难相信,离开信息技术,分子生物 学家可以完成人类基因组的测序(事实上,大规模测序中所使用的鸟枪法确实依赖于计算技术),如果没有信息技术和计算分子生物学的理论支持,研究SARS的 病毒学家也不可能在短时间内判断SARS病毒的种类归属(除非他们火眼精精能够从数以百万计的AGCT这几个符号的杂乱无章的排列中找出规律)。

生物信息学的本质即使用各种信息技术来支持生命科学的研究与开发。

BioJava简介
生物信息学在理论和工程上面临许多挑战。而要开发出复杂的生物序列分析系统,需要一些基础库的支持,BioJava就是这样的一套基础库。
BioJava是使用Java语言开发的、用于分析和表示生物序列(如DNA、RNA和蛋白质)的基础库。BioJava提供了生物序列处理功能(如转录与翻译)、文件格式转换功能和一些简单的科学计算(如隐马尔科夫模型)。

浏览 1
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报