数据科学用Jupyter Notebook再合适不过了,代码笔记融为一体,交互式操作方便好用,一直以来都是被大家所认可的神器。
最近东哥发现了一个新的Notebook工具,除了基本的功能之外,另外还补充了很多Jupyter Notebook上的一些空缺,这个新的神器就是DeepNote。DeepNote由一个位于旧金山的小团队开发,它是一种云协作、云硬件,上云的 Notebook 编程环境,可与现有的Jupter兼容,方便部署,并且免费,是新一代的数据科学notebook。这里要说下,因为Jupyter Notebook最先进入大家的视野,使用起来也没毛病,所以让使用者切换是存在一定的成本,除非新工具的功能强大到足以让你去忽略掉这个成本。
不过有高级科学研究家已发现DeepNote的使用趋势是在缓慢超越Jupyter的,这个趋势说明它确实得到了认可,并且功能上也解决了一部分人群的痛点。闲篇扯完,下面东哥介绍一下DeepNote的新功能。
这个功能东哥觉得是 DeepNote 最大的卖点了。DeepNote 支持在共享计算环境中无缝合作,也就是说当我们在做一个项目时,团队伙伴如果有了好的想法,可以更加快速的分享,而且是实时同步地看到代码运行状态。使用 Jupyter Notebook 的现有的做法是,团队每个人都必须跑完代码保存,然后再通过一些途径传给团队其他人,并且其他人如果想分析或者修改,只能再重新跑一遍,如果数据量很大或者代码很长的话,这样会浪费很多不必要的时间。这个功能就好比石墨文档可支持多人同时在线操作一样,我们不用再像以前分享Excel文件那样,每个人填好后再由最后一个人来汇总,为多人协作提供了极大的便利。但这还没完!接着看下面下面展示了多人协作中的 版本控制功能,每个人对于代码的反馈版本清晰的看见。另外,它还提供了代码review功能,我们可追踪团队成员对模型变现的评论,并且如果我们改动了代码也会同步通知评论者。此外,DeepNote 还提供了不同的权限等级:查看、执行、编辑、管理以及所有者。东哥举个例子,比如一个项目中,我们和其它合作方联合建模,你分享给对方,但不希望可执行,那么我们就可以分配权限,让自己拥有管理或所有者权限,而对方只有查看权限。再或者在自己的团队中,团队成员是有所有者权限的,可执行代码单位,而审查人员只拥有编辑权限,可提供在线反馈,但无法执行任何单元,只有团队成员持有执行权限。DeepNote 不但在多人协作上有很大优势,在个人单独建模分析时也非常的高效。
特征工程的时候,我们查看变量很不方便。DeepNote提供了强大的变量可视化功能,并且交互式体验非常棒。这个很多编辑器都有这个功能了,有它使用起来更加智能,比Jupyter Notebook好用些。DeepNote也有自己的快捷键操作,并且正在开发大屏dashboard展示功能,这样可以打通多人协作,实时在线的大屏展示成果。数据科学中有 80% 的无关数学和统计学。在云计算设置中,这个比例更接近 90%,还有 10% 的时间损失在为笔记本配置正确的算力上。DeepNote 可以为你无缝访问基于云的硬件。「无缝」的意思是你可以在笔记本界面上进行所有设置,除非你的核处于空闲状态,否则它是不会主动关闭的。Python 有出色的包管理系统。DeepNote 意识到了这一点,并在工作路径中附有 requirements.txt 文件。即使这样,也很容易忘记安装一些依赖包。除非导入包时触发错误,否则无法意识到这方面有所疏漏。为此,DeepNote 会主动监控包的导入,并根据你声明的需求,提醒你遗漏的依赖。还有,如果需要的文件不存在,它会猜测该文件是什么。剧透预警:它的猜测一般都是正确的。DeepNote 几乎提供了你想要的所有集成。为了使notebook井井有条,你可以从不同连接中选择源码控制库。这可以在创建笔记本和写后台更新时用到。除了源码控制,DeepNote 笔记本还可以连接云计算数据存储,比如 S3、GCS 以及常用的数据库引擎。以上就是DeepNote的一些独特特征,很多功能也正在开发,希望它可以越来越好,没准未来会有取代Jupyter Notebook的可能。
参考:
https://deepnote.com/
https://mp.weixin.qq.com/s/JagdY1_XQq9xOaGcWwo-Yw