53个Python库,你必须要试试

裸睡的猪

共 5418字,需浏览 11分钟

 ·

2021-04-23 11:16

作者 | 大邓
来源 | 大邓和他的Python

Python库大全

大邓将Python库整理为8部分,对每个库稍加自己的理解和评价,对Python感兴趣的同学可以收藏起来

网络爬虫数据库数据分析机器学习可视化文本分析GUI窗体软件开发自动化办公

网络爬虫

requests[1] 最好用、最简单的网络爬虫访问库BeautifulSoup[2] 最简单的网页解析库pyquery[3] 最简洁网页解析库scrapy[4] 最流行的爬虫框架pyspider[5] 国人开发的爬虫框架selenium[6] 浏览器自动化框架,可以用于爬虫反爬scylla[7] 智能IP代理池,用于反爬shreport[8] 上海证券交易所上市公司定期报告下载newspaper[9] 新闻爬虫库,根据提供的url可以抽取出新闻标题、作者、关键词、总结,部分功能支持中文

数据库

PyMySQL[10]Sqlite3[11] 轻量级sql数据库(python内置库)pymongo[12] 非关系型MongoDB库redis 缓存数据库

数据分析

pandas[13] 必须Python数据分析库,读取文件、预处理数据、分析、存储modin[14] pandas加速库,接口语法与pandas高度一致dask[15] pandas加速库,接口语法与pandas高度一致plydata[16] pandas管道语法库networkx[17] 社交网络分析库

机器学习

scikit-learn[18] 机器学习必学库,支持有监督、无监督多种算法,含文本分析功能Orange3[19] 点击操作的机器学习分析软件, 可文本分析doccano[20] 文本数据标注工具label-studio[21] 最牛掰的文本数据标注工具

可视化

matplotlib[22] Python中最万能绘图库,很少有ta画不出来的图;但语法较难、静态图seaborn[23] 基于matplotlib开发的简化版可视化库, 一般的图可以用ta绘制;高度定制仍需要结合matplotlib进行样式定制;静态图plotnine[24] ggplot2语法的Python可视化库, 可与plydata[25] 库结合使用pyecharts[26] 国人开发并封装的动态可视化图绘制库; 中文文档plotly[27] 动态可视化图绘制库bokeh[28] 动态可视化图绘制库SciencePlots[29] 科研论文绘图,基于matplotlibdatapane[30] 数据分析报告生成superset[31] 开源商务智能分析可视化库

文本分析

nltk[32] 自然语言分析套件,对中文不友好spacy[33] 工业级自然语言模型库,支持中文pattern[34] 自然语言处理、网络分析、可视化库jieba[35] 中文文本分词库snownlp[36] 中文情感分析库gensim[37] 最好用、最全的话题模型cnsenti[38] 中文情感分析库(Chinese Sentiment))可对文本进行情绪分析情感分析label-studio[39] 最牛掰的文本数据标注工具doccano[40] 文本数据标注工具textstat[41] 文本可读性计算包(算法全,但仅支持英文)texthero[42] 文本预处理、展示、可视化库,仅支持英文

GUI窗体软件开发

tkinter[43] Python内置的gui库PySimpleGUI[44] 最简单的gui开发库pyqt5、pyside[45] 最牛掰的gui软件开发库

自动化办公

zmail[46] 自动化收发邮件管理库pywinauto[47] Windows电脑自动化Python库WeasyPrint[48] 自动化生产pdf报告selenium[49] 浏览器自动化框架,可以自动化点击浏览器,完成某些工作mkdocx[50]python-docx[51] 创建、修改docx文件库python-ppt[52] 创建、修改ppt文件库openpyxl[53] xlsx文件库

References

[1] requests: https://github.com/psf/requests
[2] BeautifulSoup: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
[3] pyquery: https://github.com/gawel/pyquery
[4] scrapy: https://github.com/scrapy/scrapy
[5] pyspider: https://github.com/binux/pyspider
[6] selenium: https://github.com/SeleniumHQ/selenium/
[7] scylla: https://github.com/imWildCat/scylla
[8] shreport: https://github.com/thunderhit/shreport
[9] newspaper: https://github.com/codelucas/newspaper
[10] PyMySQL: https://github.com/PyMySQL/PyMySQL
[11] Sqlite3: https://docs.python.org/3/library/sqlite3.html
[12] pymongo: https://github.com/mongodb/mongo-python-driver
[13] pandas: https://github.com/pandas-dev/pandas
[14] modin: https://github.com/modin-project/modin
[15] dask: https://github.com/dask/dask
[16] plydata: https://github.com/has2k1/plydata]
[17] networkx: https://github.com/networkx/networkx
[18] scikit-learn: https://github.com/scikit-learn/scikit-learn
[19] Orange3: https://github.com/biolab/orange3
[20] doccano: https://github.com/doccano/doccano
[21] label-studio: https://github.com/heartexlabs/label-studio
[22] matplotlib: https://github.com/matplotlib/matplotlib
[23] seaborn: https://github.com/mwaskom/seaborn
[24] plotnine: https://github.com/has2k1/plotnine
[25] plydata: https://github.com/has2k1/plydata]
[26] pyecharts: https://github.com/pyecharts/pyecharts
[27] plotly: https://github.com/plotly/plotly.py
[28] bokeh: https://github.com/bokeh/bokeh
[29] SciencePlots: https://github.com/garrettj403/SciencePlots
[30] datapane: https://github.com/datapane/datapane
[31] superset: https://github.com/apache/superset
[32] nltk: https://github.com/nltk/nltk
[33] spacy: https://github.com/explosion/spaCy
[34] pattern: https://github.com/clips/pattern
[35] jieba: https://github.com/fxsjy/jieba
[36] snownlp: https://github.com/isnowfy/snownlp
[37] gensim: https://github.com/RaRe-Technologies/gensim
[38] cnsenti: https://github.com/thunderhit/cnsenti
[39] label-studio: https://github.com/heartexlabs/label-studio
[40] doccano: https://github.com/doccano/doccano
[41] textstat: https://github.com/shivam5992/textstat
[42] texthero: https://github.com/jbesomi/texthero
[43] tkinter: https://wiki.python.org/moin/TkInter
[44] PySimpleGUI: https://github.com/PySimpleGUI/PySimpleGUI
[45] pyqt5、pyside: https://doc.qt.io/qt.html#qtforpython
[46] zmail: https://github.com/zhangyunhao116/zmail
[47] pywinauto: https://github.com/pywinauto/pywinauto
[48] WeasyPrint: https://github.com/Kozea/WeasyPrint
[49] selenium: https://github.com/SeleniumHQ/selenium/
[50] mkdocx: https://github.com/mkdocs/mkdocs/
[51] python-docx: https://github.com/python-openxml/python-docx
[52] python-ppt: https://github.com/scanny/python-pptx
[53] openpyxl: https://openpyxl.readthedocs.io/en/stable/




更多优质文章,点击关注猪哥

👇👇👇

浏览 28
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报