硬核提效工具!发现5个应该立即开始学习的 Python 库!

Python学习与数据挖掘

共 2868字,需浏览 6分钟

 ·

2021-07-29 01:01

Python 最好的地方就是它拥有无限的开源库,基本上什么库都有。如果你读过我以前的一些文章,你可能已经注意到我非常喜欢分享一些 Python 提效工具库。

如果一个库能帮助我们解决一个问题,为什么不省下宝贵的时间来尝试一下呢?今天,我将向大家介绍5个你可能从未听说过的库,但你应该添加到管道中。我们开始吧!

PyForest

当你开始为一个项目输入代码时,你的第一步是什么?你可能会导入你需要的库,对吧?问题是你永远不知道你需要多少库,直到代码运行出现一个错误bug。这也是为什么 PyForest 是我所知道的最方便的库之一。它可以用一行代码将40个最流行的库导入到你的脚本中。

使用方法

安装如下:

pip install pyforest

要将其导入笔记本,只需要如下操作:

from pyforest import *

我们就可以开始使用库了。要检查导入了哪些库,请输入:

lazy_imports()

以上所有的库都很好用。从技术上讲,它们只有在你使用的时候才会被 importe。否则,他们不会。你可以看到诸如Pandas、Matplotlib、Seaborn、Tensorflow、Sklearn、NLTK、XGBoost、Plotly、Keras、Numpy等库。

Emot

Emot 是一个很好的库,它将表情和表情符号转换为描述性信息。对于那些不熟悉的人来说,表情符号是用人物来表达情感的方式。

使用方法

要安装它,可以输入

pip install emot

让我们用一个例子来检验一下:

它返回一个包含值、描述和位置的字典。像任何字典一样,你可以把它切分开来,专注于你需要的信息。如果我键入ans['mean'],它将只返回表情符号描述。

Geemap

Geemap 是一个 Python 库,它可以与谷歌地球引擎进行交互式映射。你可能对谷歌地球引擎及其所有功能都很熟悉,那么为什么不在下一个项目中使用它呢?

使用方法

你可以通过在终端中输入

pip install geemap

来安装它。要将其导入脚本中,可以键入

import geemap

出于演示目的,我将使用以下代码创建一个基于 folium 的交互式地图:

import geemap.eefolium as geemap
Map = geemap.Map(center=[40,-100], zoom=4)
Map

更多资料可以参考Github链接:https://github.com/giswqs/geemap

Dabl

Dabl 的目标是使初学者进行机器学习建模更容易,它在机器学习项目中使用低代码解决方案。Dabl简化了数据清理、创建可视化、构建基线模型和解释模型。让我们快速回顾一下它的一些功能。

使用方法

首先,要安装它,只需在终端中输入

pip install dabl

你可以使用:

dabl.clean(data)

来获取有关特性的信息,它还显示了连续性、范畴性和高基数特性。可以使用 dabl.clean(data) 生成有关特定函数的可视化:

你可以使用

dabl.AnyClassifier 
#or
dabl.Simplefier()

用一行代码创建多个模型,就像使用 Scikit Learn 一样。例如创建训练和测试数据集、调用、拟合和预测模型。然后,可以使用 Scikit Learn 评估模型。

# Setting X and y variables
X, y = load_digits(return_X_y=True)
# Splitting the dataset into train and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=1)
# Calling the model
sc = dabl.SimpleClassifier().fit(X_train, y_train)
# Evaluating accuracy score
print(“Accuracy score”, sc.score(X_test, y_test))

我们可以看到,Dabl迭代了多个模型,包括虚拟分类器、不同深度的决策树和Logistic回归。最后给出了最佳模型。所有这些模型只需10秒钟。很酷,对吧?我决定使用 Scikit-Learn 来测试最终的模型,以确保这个结果是可信的。结果如下:我用传统的预测方法得到了0.968的准确度,用 Dabl 得到了0.971的准确度,对我来说已经够近了!

Sweetviz

Sweetviz 是一个低代码的 Python 库,它生成漂亮的可视化效果,用两行代码启动探索性数据分析。输出是一个交互式 HTML 文件。

使用方法

my_report = sv.analyze(dataframe)
my_report.show_html()

你看到了吗?Sweetviz 能够创建一个 EDA HTML 文件,其中包含关于整个数据集的信息,并将其分解,以便你可以单独分析每个特性,同时可以获得与其他特征(最大值、最小值和最频繁值)的数字和分类关联。可视化效果也会根据数据类型而变化,你可以用 Sweetviz 做更多的有意义的事情。

结论

PyForest、Emot、Geemap、Dabl和Sweeviz是值得了解的库,因为它将复杂的任务转化为简单的任务。如果使用这些库,你将节省宝贵的时间处理那些重要的任务。我建议你亲手试试看,并探索他们的功能。如果你有新的发现,可以留言区留言。

大家好,最后给大家免费分享 Python 三件套:《ThinkPython》、《简明Python教程》、《Python进阶》的PDF电子版。如果你是刚入门的小白,不用想了,这是最好的学习教材。

现在免费分享出来,有需要的读者可以下载学习,在下面的公众号里回复关键字:三件套,就行。

领取方式:

长按下方扫码,关注后发消息 [三件套]


感谢你的分享,点赞,在看  

浏览 17
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报