9个鲜为人知的Python第三方库

Python网络爬虫与数据挖掘

共 3405字,需浏览 7分钟

 ·

2021-08-11 09:52

Python 编程充满了机会。它简单明了,拥有许多很酷的库和特色功能,可以使任务变得简单得多。每个 Python 开发人员都必须与热门的第三方库合作,如 NumPy、pandas、datetime等。然而,有一些鲜为人知的第三方库,可以让作为一个开发人员的你工作生活更容易,并改善您的编码体验。


在这篇文章中,我将分享9个这样的Python第三方库,你可能会有兴趣。其中一些库甚至可以用作一些标准 Python 图书馆的替代品。因此它们绝对是值得注意的东西!



1. pendulum

pendulum是一个很棒的与Python日期和时间类型数据工作的库。在涉及时区的情况下,此库非常有用。它继承了Python自带的datetime库,所以也可以替代原生的datetime库,功能更强大。

pip install pendulum

想看看pendulum的魔力吗?输入如下代码。

import pendulumpast = pendulum.now().subtract(minutes=2)past.diff_for_humans()

它可以将时间类型数据转化为人为可读的数据,如几分钟前,如下所示:


2.  fabulous

在命令行上运行的大多数 Python 应用程序看起来平淡无奇。fabulous可以用来给控制台的输出结果进行一个很好的改造,比如添加图像或彩色文本。

pip install fabulous

要在终端上打印彩色文本,我们可以使用:

from fabulous.color import bold, magenta, highlight_redprint(bold(magenta('''hello worldthis is some new lineand here is the last line. :)''')))

你将看到如下输出:

3. Pywebview

Pywebview 是一个Python第三方库,用于以 GUI 形式显示 HTML、CSS 和 JavaScript 内容。这意味着使用此库,您可以将您的网站或网页显示为桌面应用程序。

pip install pywebview

要启动显示特定网站的窗口,我们只需要运行:

import webviewwindow = webview.create_window(    title='Baidu Webview',    url='http://www.baidu.com',    width=850,    height=600,    resizable=False,    # 固定窗口大小    text_select=False,   # 禁止选择文字内容    confirm_close=True   # 关闭时提示)webview.start()


4. Seaborn 

Seaborn 是一个用于数据科学项目数据可视化的库。它建在标准可视化库 Matplotlib 之上,可以使绘图更加丰富多彩和有吸引力。

pip install seaborn

要使用数据集制作线图,我们可以使用:

import seaborn as snsdataset=sns.load_dataset('dataset name')sns.lineplot(x='x-axis name', y='y-axis name', data = dataset)

5. Psutil 

Psutil 是一个有用的跨平台 Python 库,可以用于获取与系统相关的信息。您可以收集有关系统中正在进行的流程、CPU 使用、RAM 使用等的信息。


使用以下命令安装 psutil。

pip install psutil

要每 3 秒内计算系统 CPU的使用情况,我们可以运行:

import psutilpsutil.cpu_percent(interval=3)


6. pygame

顾名思义,它是Python制作游戏的库。它包含许多图形和声音库,开发人员可以用来制作游戏。此外,复杂的游戏逻辑和物理也可以使用PyGame的内置模块实现。


要安装PyGame,我们需要使用:

pip install pygame


7. pyforest

在进行数据科学项目时,我们刚开始通常需要导入许多库,如Numpy, pandas, matplotlib等,如下所示:

import pandas as pdimport statisticsimport numpy as npimport seaborn as snsimport matplotlib as mplimport matplotlib.pyplot as plt

这样过于繁琐,pyforest可以帮助我们一次性安装导入所有重要的库。


pip install pyforest

使用pyforest,你既可以省去大量的import操作,又能够做到惰性导入, 如下所示:

from pyforest import *
df = pd.DataFrame()print(df)
active_imports() # 输出导入的模块

8. modin

modin 是一个python库,通过使用机器的多核而不是单核来改善pandas的工作流程。这对于在处理大型数据集时提高性能特别非常有帮助。

pip install modin

安装好后,你只需导入modin的pandas版本,甚至不需要对源代码进行进一步的更改,


import modin.pandas as pd


9. pandas_profiling

这是一个 Python 库,可用于获取数据集、其属性和属性之间的相关性的概述(overview)。

可以使用下面显示的命令安装它。

pip install pandas-profiling

pandas_profiling基于pandas的DataFrame数据类型,可以简单快速地进行探索性数据分析。对于数据集的每一列,pandas_profiling会提供以下统计信息:

1、概要:数据类型,唯一值,缺失值,内存大小
2、分位数统计:最小值、最大值、中位数、Q1、Q3、最大值,值域,四分位

3、描述性统计:均值、众数、标准差、绝对中位差、变异系数、峰值、偏度系数

4、最频繁出现的值,直方图/柱状图

5、相关性分析可视化:突出强相关的变量,Spearman, Pearson矩阵相关性色阶图


使用方式如下所示:

from pandas_profiling import ProfileReportreport = ProfileReport(dataframe)report.to_file(output_file='output.html')

您可以保存此报告作为HTML或pdf文件做进一步分析。

小结

以上就是个人推荐的9个第三方Python库,可用于改善您的编码体验并取代现有的标准 Python 库。如有兴趣,您可以阅读本文所提到的相关库的详细教程,其中大多数是免费开源的。这些库绝对可以让你作为开发人员的生活更轻松。


你听说过几个?用过几个? 欢迎留言!


原文:9 Unexplored Python Libraries that Will Amaze You(medium.com)

原作: Pranjal Saxena  翻译: 大江狗


- EOF -

回复关键字“简明python ”,立即获取入门必备书籍简明python教程》电子版

回复关键字爬虫”,立即获取爬虫学习资料

点击关注【python入门与进阶】,阅读更多精彩内容
👇👇👇

推荐

浏览 37
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报