Python 数据科学中的 Seaborn 绘图可视化
Python中文社区
共 3673字,需浏览 8分钟
· 2021-08-30
pip install seaborn
https://seaborn.pydata.org/
https://seaborn.pydata.org/api.html
Financial Sample.xlsx
import pandas as pd
import seaborn as sns
#如果使用 Jupyter Notebooks,下面的行允许我们在浏览器中显示图表
%matplotlib inline
#在 Pandas DataFrame 中加载我们的数据
df = pd.read_excel('Financial Sample.xlsx')
#打印前 5 行数据以确保正确加载
df.head()
#绘制 DataFrame "Profit" 列的分布
sns.displot(df['Profit'])
#设置我们希望用于绘图的样式
sns.set_style("darkgrid")
#绘制 DataFrame "Profit" 列的分布
sns.displot(df['Profit'])
“kde=False”
,我们可以删除 KDE。我们还可以按如下方式更改直方图中“bins”
的数量——在本例中,它们被设置为 50:sns.displot(df['Profit'],kde=False,bins=50)
“Profit”
列与“Units Sold”
列。sns.jointplot(x='Profit',y='Units Sold',data=df)
sns.jointplot(x='Profit',y='Units Sold',data=df,kind='hex')
“kind”
添加的另一个参数是“reg”
,它代表回归。这看起来很像散点图,但这次将添加线性回归线。sns.jointplot(x='Profit',y='Units Sold',data=df,kind='reg')
“kde”
,它将绘制一个二维 KDE 图,它基本上只显示数据点最常出现的位置的密度。sns.jointplot(x='Profit',y='Units Sold',data=df,kind='kde')
“pairplots”
。这些使我们能够查看整个数据帧(对于数值数据)的成对关系,并且还支持分类数据点的“色调”参数。所以 pairplot 本质上是为 DataFrame 中数字列的每个可能组合创建一个联合图。我将快速创建一个新的 DataFrame,它删除“Month Number”和“Year”列,因为这些并不是我们连续数字数据的一部分,例如“利润”和“COGS”(销售成本)。我还将删除其他几列以缩小我们的 DataFrame,这样我们的输出图就不会过于拥挤。#删除不需要的列
new_df = df.drop(['Month Number','Year','Manufacturing Price','Sale Price'],axis=1)
sns.pairplot(new_df)
sns.pairplot(new_df,hue='Segment')
sns.pairplot(new_df,hue='Segment',palette='magma')
“rugplot”
——这将帮助我们构建和解释我们之前创建的“kde”图是什么——无论是在我们的 distplot 中还是当我们传递“kind=kde”
作为我们的参数时。sns.rugplot(df['Profit'])
#设置一组 30 个取自正态分布的数据点
x = np.random.normal(0, 1, size=30)
#设置 KDE 点的带宽
bandwidth = 1.06* x.std() * x.size ** (-1/ 5.)
#设置 y 轴的限制
support = np.linspace(-4, 4, 200)
#遍历数据点并为每个点创建内核,然后绘制内核
kernels = []
for x_i in x:
kernel = stats.norm(x_i, bandwidth).pdf(support)
kernels.append(kernel)
plt.plot(support, kernel, color="r")
sns.rugplot(x, color=".2", linewidth=3)
#使用复合梯形规则沿给定轴积分并创建 KDE 图
from scipy.integrate import trapz
density = np.sum(kernels, axis=0)
density /= trapz(density, support)
plt.plot(support, density)
“kdeplot”
绘制 KDE 图。sns.kdeplot(x, shade=True)
评论
多人同时导出 Excel 干崩服务器!新来的阿里大佬给出的解决方案太优雅了!
点击关注公众号,Java 干货及时推送↓推荐阅读:面试辅导,我们出大成果了!来源:juejin.cn/post/7259249904777838629前言 业务诉求:考虑到数据库数据日渐增多,导出会有全量数据的导出,多人同时导出可以会对服务性能造成影响,导出涉及到mysql查询的io操作,
Java技术栈
1
Go 1.22 的新增功能系列之二:reflect.TypeFor
Go 1.22 的第一个候选版本已经发布,这意味着最终版本即将发布,现在是我在博客中介绍我在这个周期中所做工作的时候了。像往常一样,我的贡献很小,但它们是我的,所以我将从幕后的角度来谈谈它们。首先是reflect.TypeFor。这是整个函数:// TypeFor returns the [Type
GoCN
0
有意思!一个关于 Spring 历史的在线小游戏
发现 Spring One 的官网上有个好玩的彩蛋,分享给大家!进到Spring One的官网,可以看到右下角有个类似马里奥游戏中的金币图标。点击该金币之后,会打开一个新的页面,进入下面这样一个名为:The History Of Spring 的在线小游戏你可以使用上下左右的方向键来控制Spring
公众号程序猿DD
1
了解加密货币到加密货币的互换
1、什么是加密货币互换?加密货币到加密货币的互换是指以现行市场汇率将一种加密货币直接兑换为另一种加密货币。与需要法定货币存款和较长流程的传统交易所不同,加密货币到加密货币的互换可以无缝地促进交换。掉期在提高加密货币的流动性和效率方面发挥着重要作用。该功能使用户能够将他们的加密货币与钱包中的其他代币进
区块链头条
0
李彦宏:开源大模型不如闭源,后者会持续领先;周鸿祎:“开源不如闭源” 的言论是胡说八道
架构师大咖
架构师大咖,打造有价值的架构师交流平台。分享架构师干货、教程、课程、资讯。架构师大咖,每日推送。
公众号该公众号已被封禁0、李彦宏:开源大模型不如闭源,后者会持续领先当今
源码共读
0
Go早期是如何在Google内部发展起来的
2007年Go诞生于Google,2009年Google正式对外宣布了Go语言的开源!时至今日,距离Go开源已经过去了近15个年头了[1]!Go在Google公司内部究竟是怎样的一个状态呢?前Google员工Yves Junqueira近期撰文从其个人所见所闻谈了Go在Google的历程[2]!这里
GoCN
0
【第129期】程序员的新宠:三款终端工具,让你告别Xshell!
概述 WindTerm:跨平台的SSH利器 首先介绍的是WindTerm,这是一款使用C语言开发的跨平台SSH客户端。它不仅完全免费,而且没有商业使用的限制。WindTerm支持SSH v2、Telnet、Raw Tcp等协议,而且性能出色,甚至超过了FinalShell和Electerm。功能
前端微服务
0
字节员工:35岁以后被裁员的,后来都走了哪条路?现在2-2,要不要利用最后一年拼命上个岸。
架构师大咖
架构师大咖,打造有价值的架构师交流平台。分享架构师干货、教程、课程、资讯。架构师大咖,每日推送。
公众号该公众号已被封禁在当今竞争激烈的职场环境中,年龄并不总是一个决定性
源码共读
0