bcbio-nextgen为全自动高通量测序分析提供最佳实践管道的工具
bcbio-nextgen是一个Python工具,它为全自动高通量测序分析提供了最佳的实践管道。当用户编写一个高级配置文件指定输入和分析参数后,该用户的输入可以驱动处理分布式运算、幂等进程重启以及安全事务步骤的并行管道。bcbio的目标是提供一个能够进行数据测序分析处理组件的资源共享社区,以此能够让研究人员更专注于下游生物科学的研究。
目标
bcbio-nextgen实现全自动高通量测序数据分析的目标主要包含以下方面:
-
可量化性:优秀的科学研究需要能够准确地评估结果的质量,新的算法和软件成为可用。
-
可分析性:将结果导入工具使得查询结果与可视化结果更加容易。
-
可扩展性:在分布式异构计算环境中处理大数据集以及样本数据。
-
可复用性:跟踪配置,版本,来源以及命令行以便对结果的调试、扩展以及复用。
-
社区开发:开发过程是完全开放的并且由来自多个社区的贡献者来共同维护。通过在共享框架上的协作,我们可以克服在迅速变化的研究领域维护复杂管道的挑战。
-
易理解性:生物信息学家、生物学家和公众能够将研究材料、个人基因组的临床样本数据等各种数据作为输入来运行整个工具。
评论