天池和Kaggle:Notebook使用对比

机器学习初学者

共 1842字,需浏览 4分钟

 ·

2021-03-20 11:10

天池竞赛平台作为阿里云旗下的重要竞赛社区,每年都会举办上百场数据竞赛。数据竞赛不仅可以汇集参赛选手,同时也可以沉淀具体的学习内容。

拿Kaggle举例,其魅力之处就在于Kaggle Notebook有很多丰富的学习资料,可以供学习者学习和使用。

从2019年开始天池逐步推出DSW (Data Science Workshop)运行环境,可供选手可以在云平台完成编码和学习。据笔者了解,天池DSW是国内首个支持GPU和CPU的学习环境,非常值得使用的。

本文从在线学习环境的角度(即在线Notebook)将天池与Kaggle进行对比:

  • Notebook与平台生态
  • Notebook使用体验对比

Notebook与平台生态

首先我们从Notebook与竞赛平台生态进行分析,在天池和Kaggle中在线Nobteook都是非常重要的一个环节。开源在竞赛中随处可见,从竞赛参赛方式、赛题数据集到赛题在线Notebook,都是各种的众包参与形式,且内容都可以多人一起贡献。


在上述元素中,Notebook是特别重要的一个环节。

  • 天池Notebook(DSW):https://tianchi.aliyun.com/notebook-ai/
  • Kaggle Notebook:https://www.kaggle.com/notebooks

Notebook作为在线运行环境:

  • 提供一个配置好环境的运行的环境,所有参赛选手免去在本地配置环境的环节;
  • 可以作为代码和思路的分享,比如比赛分析过程和解决方案的展示;
  • 可以作为比赛比赛提交的入口,如比赛最终提交可以从Notebook提交;
  • 可以提供系列的学习资源和实践教材,可以作为在线教材;

Notebook作为在线展示方式:

  • 具备有版本存储的功能,可以存储历史运行的代码;
  • 具备有渲染Markdown、图片和公式的功能,展示方式更加灵活;
  • 具备有与数据集和比赛交互的过程;

Notebook使用体验

Kaggle Notebook界面

https://www.kaggle.com/code

天池DSW界面

https://dsw-dev.data.aliyun.com/

Notebook对比


天池DSWKaggle Notebook
界面Juypter Lab自定义网页
使用时间总共使用时间不限制
CPU和GPU单次链接8小时
每次链接可以运行多个Notebook
CPU时间不限,GPU每周35小时
可以同时运行多个CPU Notebook
只能运行一个GPU Notebook
文件目录工作目录与文件目录混合工作目录与数据文件分开
文件系统多个Notebook共享单个Notebook独占
Markdown目录支持不支持
数据集支持挂载数据集支持挂载数据集
内存4G,多个Notebook共享16G,单个Notebook独占
显存16G,多个Notebook共享11G,单个一个Notebook独占
联网CPU模型可以联网
GPU模型不可以联网
CPU和GPU都可以联网
稳定性CPU较为稳定
GPU稳定性一般
较为稳定
Shell支持不支持
上传文件支持不支持,可在Dataset页面上传
发布支持发布到天池论坛支持发布到Kaggle论坛
版本支持版本管理,但不完善支持版本管理,比较完善
Copy & Fork支持支持
评论支持支持

从上表对比可知,天池DSW与Kaggle Notebook环境虽然整体都为在线Notebook,但在使用上存在一定的差异性:

  • 资源分配:天池DSW环境可以同时运行多个Notebook,且多个Notebook资源共享;Kaggle Notebook每个资源独立,且文件各自不共享;
  • 使用方式:天池DSW环境与Juypter Lab比较类似,而Kaggle Notebook是固定好输入情况下的代码运行环境;

从使用角度天池DSW比较灵活强大,而Kaggle Notebook每个功能比较单一。所以如果大家在国内,建议使用天池DSW。


往期精彩回顾





本站qq群851320808,加入微信群请扫码:

浏览 64
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报