那些被低估了的 Python 库
译文:头条号:机器学习与数据分析 原文:
https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270
在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。
    混合派
- 
     
Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。  - 
     
tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。  - 
     
Colorama:简单的跨平台彩色终端文本。  - 
     
pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。  - 
     
Pandas-flavor:扩展pandas DataFrame/Series的简单方法。  - 
     
More-Itertools:增加了类似于itertools的额外功能。  - 
     
streamlit:为机器学习项目创建应用程序的简单方法。  
数据清理和操作
- 
     
ftfy:修复mojibake和Unicode文本中的其他故障。  - 
     
janitor:有很多很酷的功能来清理数据。  - 
     
Optimus:另一个数据清理包。  - 
     
Great-experctations:一个检查数据是否符合预期的好工具。  
    数据探索和建模
- 
     
Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。  - 
     
dabl:允许使用可视化和预处理进行数据探索。  - 
     
pydqc:允许比较两个数据集之间的统计数据。  - 
     
pandas-summary:对panda DataFrames描述功能的扩展。  - 
     
pivottable-js:pands在jupyter notebook的拖放功能。  
数据结构
- 
     
Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。  - 
     
Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。  - 
     
datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。  - 
     
ranges:Python的连续范围、范围集和范围令数据结构  
    性能检查和优化
- 
     
Py-spy: Python程序的采样分析器。  - 
     
pyperf:用于运行Python基准测试的工具箱。  - 
     
snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。  - 
     
Cachier: Python函数的持久、无延迟、本地和跨机缓存。  - 
     
Faiss:用于高效的相似性搜索和密集向量聚类的库。 
 
— 完 —
回复下方「关键词」,获取优质资源
回复关键词「简明python」,立即获取入门必备书籍《简明python教程》电子版
回复关键词「爬虫」,立即获取 爬虫学习资料
推荐阅读
- 
     
美国要求字节跳动放弃TikTok所有权,微软考虑收购,网友:明抢?  - 
     
分分钟甩Word几条街,Python编辑公式竟可以如此简单  - 
     
适合 Python 入门的 8 款强大工具!  - 
     
开源!北大研究生把《统计学习方法》书中全部算法都实现了! 
 

评论
