50T内存?百万机时?头一次见这么耗费内存和机时的分析?

生信宝典

共 912字,需浏览 2分钟

 ·

2021-06-17 19:32

朋友发来一个公司的分析报价单,让我看看。这些分析虽不是太懂,不过也了解一些。人的CIRCOS是画过的,我的小破服务器(32核,256G内存)处理起来没任何压力。一个家族基因鉴定、进化分析据说一台普通笔记本都可以做。重复序列多时分析是困难些,50T内存,倒显得我孤陋寡闻了。

之前总有学员问起宏基因组分析需要内存多大,我说300G起(尤其是Kraken1时,没这么多内存,数据库索引都建不起来;当然也取决于数据量,一台几十G内存的电脑也可以完成宏基因组大部分分析)。学员去问了其它知名博主,得到的回答是“你听错了,说的应该是300G硬盘”。那如果看到这个50T的内存会怎么想呢?顺手查了下,50T确实也不算高。比如天河2号共有1.4PB内存。这样看,倒是小巫见大巫了。

1000000 CPU*H应该是100万CPU时间;假如是并行1000核,算一下需要41天 (1000000 / 1000 / 24 = 41.67),我怀疑我算错了?

如果用天河2号就快了,312万个计算核心,也就是20分钟的时间。

当然天河2号还不是最快的,看看下面这个表

沙特也在前10,有钱真好!不过石油也确实是需要用到大型计算的地方。记得10多年前在中科院计算所上课时,高性能计算老师讲过,(那时)国内的超级计算机都在每天哭穷的中石油、中海油等手里。

看到大型机,想起来有次坐公交车遇到一位老先生,军工做大型机的。聊起来,问我做什么的?我说做IT的(生物信息解释起来有些麻烦)。老大爷说工资应该不错吧,有1万多吧? 这就尴尬了,刚说了做IT的就被问到工资,不能给IT丢脸啊,打肿脸充胖子,没有也不能承认啊,心虚的点个头,说了句“差不多”。接着又被老大爷刺激了,“我们单位做IT的小伙比你多多了~~~”

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

浏览 7
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报