天池和Kaggle:Notebook使用对比
机器学习初学者
共 1842字,需浏览 4分钟
·
2021-03-20 11:10
天池竞赛平台作为阿里云旗下的重要竞赛社区,每年都会举办上百场数据竞赛。数据竞赛不仅可以汇集参赛选手,同时也可以沉淀具体的学习内容。
拿Kaggle举例,其魅力之处就在于Kaggle Notebook有很多丰富的学习资料,可以供学习者学习和使用。
从2019年开始天池逐步推出DSW (Data Science Workshop)运行环境,可供选手可以在云平台完成编码和学习。据笔者了解,天池DSW是国内首个支持GPU和CPU的学习环境,非常值得使用的。
本文从在线学习环境的角度(即在线Notebook)将天池与Kaggle进行对比:
Notebook与平台生态 Notebook使用体验对比
Notebook与平台生态
首先我们从Notebook与竞赛平台生态进行分析,在天池和Kaggle中在线Nobteook都是非常重要的一个环节。开源在竞赛中随处可见,从竞赛参赛方式、赛题数据集到赛题在线Notebook,都是各种的众包参与形式,且内容都可以多人一起贡献。
在上述元素中,Notebook是特别重要的一个环节。
天池Notebook(DSW):https://tianchi.aliyun.com/notebook-ai/ Kaggle Notebook:https://www.kaggle.com/notebooks
Notebook作为在线运行环境:
提供一个配置好环境的运行的环境,所有参赛选手免去在本地配置环境的环节; 可以作为代码和思路的分享,比如比赛分析过程和解决方案的展示; 可以作为比赛比赛提交的入口,如比赛最终提交可以从Notebook提交; 可以提供系列的学习资源和实践教材,可以作为在线教材;
Notebook作为在线展示方式:
具备有版本存储的功能,可以存储历史运行的代码; 具备有渲染Markdown、图片和公式的功能,展示方式更加灵活; 具备有与数据集和比赛交互的过程;
Notebook使用体验
https://www.kaggle.com/code
https://dsw-dev.data.aliyun.com/
Notebook对比
天池DSW | Kaggle Notebook | |
---|---|---|
界面 | Juypter Lab | 自定义网页 |
使用时间 | 总共使用时间不限制 CPU和GPU单次链接8小时 每次链接可以运行多个Notebook | CPU时间不限,GPU每周35小时 可以同时运行多个CPU Notebook 只能运行一个GPU Notebook |
文件目录 | 工作目录与文件目录混合 | 工作目录与数据文件分开 |
文件系统 | 多个Notebook共享 | 单个Notebook独占 |
Markdown目录 | 支持 | 不支持 |
数据集 | 支持挂载数据集 | 支持挂载数据集 |
内存 | 4G,多个Notebook共享 | 16G,单个Notebook独占 |
显存 | 16G,多个Notebook共享 | 11G,单个一个Notebook独占 |
联网 | CPU模型可以联网 GPU模型不可以联网 | CPU和GPU都可以联网 |
稳定性 | CPU较为稳定 GPU稳定性一般 | 较为稳定 |
Shell | 支持 | 不支持 |
上传文件 | 支持 | 不支持,可在Dataset页面上传 |
发布 | 支持发布到天池论坛 | 支持发布到Kaggle论坛 |
版本 | 支持版本管理,但不完善 | 支持版本管理,比较完善 |
Copy & Fork | 支持 | 支持 |
评论 | 支持 | 支持 |
从上表对比可知,天池DSW与Kaggle Notebook环境虽然整体都为在线Notebook,但在使用上存在一定的差异性:
资源分配:天池DSW环境可以同时运行多个Notebook,且多个Notebook资源共享;Kaggle Notebook每个资源独立,且文件各自不共享; 使用方式:天池DSW环境与Juypter Lab比较类似,而Kaggle Notebook是固定好输入情况下的代码运行环境;
从使用角度天池DSW比较灵活强大,而Kaggle Notebook每个功能比较单一。所以如果大家在国内,建议使用天池DSW。
往期精彩回顾
本站qq群851320808,加入微信群请扫码:
评论