512块A100,AlphaFold训练时间从11天压缩至67小时
视学算法
共 4754字,需浏览 10分钟
·
2022-03-06 16:20
视学算法报道
编辑:小舟、蛋酱
AlphaFold 虽好,但耗时且成本高,现在首个用于蛋白质结构预测模型的性能优化方案来了。
支持 Evoformer 中的所有计算模块;
所需的通信量比张量并行小得多;
显存消耗比张量并行低;
给通信优化提供了更多的空间,如计算通信重叠。
© THE END
转载请联系原公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
点个在看 paper不断!
评论
CVPR 2024 Highlight | 北航等发布「时间特征维护」:无需训练,极致压缩加速Diffusion
新智元报道 编辑:LRST 好困【新智元导读】拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!近日,北航、莫纳什、UT Austin联合推出了时间特征维护的扩散模型低精度无损量化方法TFMQ-DM。不仅以4bit的权重大
新智元
0