没用过这几招,别说你会使用Jupyter Notebook!

大邓和他的Python

共 2034字,需浏览 5分钟

 · 2020-11-04

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~


d5adc34bf19ebe97cc4c45b559b92cc7.webp




如果你想用Python进行数据分析,那么Jupyter notebook是你必须要熟练掌握的工具之一,而Notebook也有很多省时好用的小技巧,本文将分享我在使用Notebook时习惯使用的一些操作!

  1.在Notebook中安装第三方库

有时我们在进行数据分析的过程中,或者是使用一些在线/远程Notebook,需要临时安装一个第三方库,如果从命令行(甚至没有命令行界面)安装后再重启notebook,那么所有进度都将丢失!

这时我们可以使用!pip install xxx 就可以直接在notebook将第三方库安装到本地,比如安装pyecharts

! pip install pyecharts
0f3a51a3a8de6869e518952c090370a0.webp

其实!就是在notebook中执行shell语句的符号,你也可以使用!来执行! ls等任意命令行代码。

  2.在Notebook中使用markdown

以前经常有粉丝让我帮忙给他看代码,发来的.ipynb文件打开后,所有说明性的文字都用#来注释给出,读起来那是一个难受。

ddda5027e334c87342996097b908a379.webp

其实在Notebook中也可以使用markdown语句,写文字、打公式、贴图片都很轻松,就像上图一样只需要选中目标单元格,然后按下ESC,再按下M即可,也可以在菜单栏将当前单元格转为标签

  3.快速计算运行时间

有时候我们需要计算一些函数或过程运行时间,以此来衡量代码的效率,在其他IDE可能需要写个函数或者使用第三方模块来完成,而在Notebook中,提供了便捷的魔法函数?

  • %time:在行模式下,代码运行一次所花费的时间
  • %%time:在单元模式下,代码运行一次所花费的时间
  • %timeit:在行模式下,执行代码块若干次,取最佳结果
  • %%timeit:在单元模式下,执行代码块若干次,取最佳结果

这样我们只要敲几下键盘,就能快速得到代码块的运行时间?83798c49ea2dee3c2da88d9a23e7d883.webp

  4.查看当前变量

当我们的代码越写越多,定义的变量越来越多,有时候就容易忘记曾经起过哪些名字,这时候回去翻代码是痛苦的,而在Notebook中,可以使用%who_ls查看当前定义了多少变量3539d8cceaec362265897a9e796839dd.webp

当然也可以指定变量类型查看,比如查看有哪些变量是字符串b117ab40e6c0e6293b26bfc4fdaee059.webp

  5.一次删除多行

有时候,当我们将别人的代码复制进Notebook后,常常会发生缩进错误408093077f04a75a16e86f3f3ad0cd05.webp就像上图所示的一样,如果我们手动删除红框中的空白,那将会是很无聊的,需要按很多次退格键,这时我们可以按住option(Win下为Alt)键,此时光标会变成字形,现在就可以选中目标区域一次性删除?

a360a9b353d1d9413b05000a2a7ecdff.webp

  6.直接获取文档

如果我们需要查看某些函数的用法,可能需要通过百度或者查找官方文档,额外打开很多页面来检索,其实在Notebook中可以使用Shift + Tab直接获取该方法的文档


8082ea95d735fb1eebd149e2b5be2320.webp

就像上图一样,直接显示pd.merge的用法,一目了然,点开还能查看更详细的解释?

415d4f1eeb8b4251cf808af681f8b5b6.webp

  7.加载外部文件

还是魔法命令,使用%load 可以直接加载外部文件,比如%load test.py就可以直接在notebook中打开对应文件,省去切换页面-复制粘贴的时间。

fa699743ac17805b75e464597b59ad4c.webp

直接打开在线文档也是可以的,比如打开Matplotlib官方文档中的示例代码

%load http://matplotlib.org/mpl_examples/pylab_examples/contour_demo.py


  8.直接运行Python脚本

上面是直接打开外部文件,那么能不能直接运行?答案是可以的,只要使用%run xxx.py即可在notebook中运行Python脚本并输出结果,以运行当前工作目录下的test.py为例

%run test.py

d2c0e10d9788903633d672791dbd7853.webp

以上就是我在使用Jupyter Notebook时常用的8个命令,并且使用上述命令无需安装任何插件/外部模块,快去试试吧。


近期文章

Python网络爬虫与文本数据分析bsite库 | 采集B站视频信息、评论数据
rpy2库 | 在jupyter中调用R语言代码tidytext | 耳目一新的R-style文本分析库reticulate包 | 在Rmarkdown中调用Python代码plydata库 | 数据操作管道操作符>>plotnine: Python版的ggplot2作图库
七夕礼物 | 全网最火的钉子绕线图制作教程
读完本文你就了解什么是文本分析
文本分析在经管领域中的应用概述  综述:文本分析在市场营销研究中的应用
plotnine: Python版的ggplot2作图库小案例: Pandas的apply方法  stylecloud:简洁易用的词云库 用Python绘制近20年地方财政收入变迁史视频  Wow~70G上市公司定期报告数据集
漂亮~pandas可以无缝衔接Bokeh  YelpDaset: 酒店管理类数据集10+G  
分享”和“在看”是更好的支持!
浏览 67
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报