如何在云服务器上跑深度学习的代码?(ResNet50为例)
一、选择一款云服务器
● 小编选择的 “矩池云”,感觉操作比较方便,也能跑通代码。
● 矩池云官网:。
● 一进去,经过一些 “操作” 能获得 5
元的体验金,可以用来练手。
二、上传代码和数据
● 然后打开 个人中心
,进入 我的网盘
,点击 上传
来把本地的代码和数据上传上来。【如下图所示】
● 为了快速练手,小编已经把代码和数据封装好了。
● ResNet50 + 猫狗数据集(25000张):,提取码:xwdd
三、解压“代码和数据的压缩包”
● 点击左上角的 主机市场
,再点击 CPU
,进入准备租用 CPU 来解压。【如下图所示】
● 随便选一款就可以。【如下图所示】
● 随便选一个就可以,小编一般选 PyTorch 1.7.1
,然后点击 下单
。【如下图所示】
● 然后会自动跳出 租用界面
,等待一会儿后会出现下面两个 链接
,点击 JupyterLab链接
。
● 再点击 Terminal
,进入服务器终端。
● 然后我们依次输入以下代码来解压 代码
和 数据
:【如下图所示】
cd /mnt
unzip ResNet50-Test-CSDN.zip
unzip cat-dog-all-data.zip
◆ 注:解压图片会花费较长时间(≈1min)。另外,cat-dog-all-data.zip
解压得到的是名为 test-dataset
的文件夹。
● 解压完后,再返回 租用界面
,点击 停止并释放
。之后去看看 我的网盘
,就会变成下图:
四、训练 ResNet50 神经网络
● 点击左上角的 主机市场
,再点击 GPU
,进入准备租用 GPU 来训练。【如下图所示】
● 选一个关于 Pytorch
的配置(因为小编的 ResNet50 是基于它所写的),小编一般选 PyTorch 1.7.1
,然后点击 下单
。【如下图所示】
● 然后我们依次输入以下代码来训练:
cd /mnt
python main.py test-dataset
◆ 注:main.py
就是 ResNet50代码
,test-dataset
是 25000
张猫狗数据集,已按 9:1
的比例划分成训练集和测试集。批训练大小:batch_size = 64
。二分类。
● 至此,基本的操作就写完了。如果需要涉及多 GPU 分布式训练,就要同时租用多个 GPU 即可。
● 如果说代码出错,会在这个终端框中提示出来。但是如果要改代码,只得在本地改好,再上传,再解压,再跑。这样有点麻烦。但小编还是用的这种比较笨的方法,最后完成了项目。
● 另外有一种解决方案,可以用本地的 PyCharm 远程连接服务器进行及时的调试。但这个需要 专业版的PyCharm
,要 money,小编还没用过,以后有机会再来做这方面的研究的话,再补一篇博文吧。
ps:为了写一篇 1:1 的指南篇,专门用室友的手机重新注册了一个账号,一步一步地截图来写的… ⭐️ ⭐️