有bug!PyTorch在AMD CPU的计算机上卡死了
极市导读
AMD,No?PyTorch在AMD CPU的机器上出现死锁了。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
遇到了什么 bug
使用带有 AMD cpu 和多个 NVIDIA gpu 的机器;
Linux、Python3.8、cuda 11.0、pytorch 1.7.1、 torchvision 0.8.2;
编写代码在 torchvision 中训练 resnet18 模型;
可以尝试测试数据并行 (DP) 和分布式数据并行(DDP),以检查是否都会出现这种情况。
当使用 AMD cpu 时,在训练的第一个 epoch 和第一次迭代的前向传播时会发生死锁;
当使用 intel cpu 时,相同的代码运行良好。
尚未解决
推荐阅读
2021-04-02
2021-04-02
2021-04-01
# CV技术社群邀请函 #
备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)
即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群
每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~
评论