活用Pandas:将Excel转为html格式
共 1696字,需浏览 4分钟
· 2021-05-20
大家好,我是小五🚀
大家谈及用Pandas
导出数据,应该就会想到to.xxx
系列的函数。
这其中呢,比较常用的就是pd.to_csv()
和pd.to_excel()
。但其实还可以将其导成Html网页格式,这里用到的函数就是pd.to_html()
!
读取Excel
今天我们要实现Excel转为html格式,首先需要用读取Excel中的表格数据。
import pandas as pd
data = pd.read_excel('测试.xlsx')
查看数据
data.head()
下面我们来学习把DataFrame转换成HTML表格的方法。
生成Html
to_html()
函数可以直接把DataFrame转换成HTML表格,只需一行代码即可实现:
html_table = data.to_html('测试.html')
运行上面代码后,工作目录中多了测试.html
文件,使用网页浏览器打开它,显示内容如下👇
print(data.to_html())
通过print打印,可以看到DataFrame的内部结构被自动转换为嵌入在表格中的<TH>
,<TR>
,<TD>
标签,保留所有内部层级结构。
调整格式
我们还可以自定义修改参数,来调整生成HTML的格式。
html_table = data.to_html('测试.html',header = True,index = False,justify='center')
再次打开新生成的测试.html
文件,发现格式已经发生了变化。
如果想对格式进行进一步调整(增加标题、修改颜色等),就需要一些HTML知识了,可以对生成的测试.html
文件中的文本进行调整。
对于有些小伙伴可能需要进行页面展示,就要搭配Flask库来使用了。
小结
Pandas提供read_html()
,to_html()
两个函数用于读写html格式的文件。这两个函数非常有用,一个轻松将DataFrame等复杂的数据结构转换成HTML表格;另一个不用复杂爬虫,简单几行代码即可抓取Table表格型数据,简直是个神器!
to_html()
这个函数。使用该函数最大的优点是:我们在不了解html知识的情况下,就能生成一个表格型的HTML。精选文章
系列视频|Python网络爬虫与文本数据分析 语法最简单的微博通用爬虫weibo_crawler hiResearch 定义自己的科研首页 大邓github汇总, 觉得有用记得star multistop ~ 多语言停用词库 Jaal 库 轻松绘制动态社交网络关系图 来自kaggle最佳数据分析实践 B站视频 | Python自动化办公 SciencePlots | 科研样式绘图库 使用streamlit上线中文文本分析网站 bsite库 | 采集B站视频信息、评论数据 texthero包 | 支持dataframe的文本分析包 爬虫实战 | 采集&可视化知乎问题的回答 reticulate包 | 在Rmarkdown中调用Python代码 plydata库 | 数据操作管道操作符>> plotnine: Python版的ggplot2作图库 读完本文你就了解什么是文本分析 文本分析在经管领域中的应用概述 综述:文本分析在市场营销研究中的应用 plotnine: Python版的ggplot2作图库 Wow~70G上市公司定期报告数据集 漂亮~pandas可以无缝衔接Bokeh YelpDaset: 酒店管理类数据集10+G
“分享”和“在看”是更好的支持