seaborn和pandas

您所在的位置:网站首页 seaborn中绘制回归图的方法有哪些 seaborn和pandas

seaborn和pandas

2024-07-15 03:26:18| 来源: 网络整理| 查看: 265

目录

0、seaborn包基本使用

1 pandas打印报表(推荐使用)

2 缺失值分析--Missingno

1,对于每一列数据进行分析缺失值

矩阵图

柱状图

热力图

3.画分布图--比如正太分布图seaborn

4、数据可视化--

1,热度图seaborn--满足条件的数据的个数如年龄段为2的女生有多少人

2、柱状图(查看其中一个特征的每一个种类有多少--比如男性有多少,女性有多少)

seaborn

pandas

5、多变量之间的关系(连续变量)推荐散点图

pandas

seaborn  三个变量(两个连续画点,一个离散分类)

两个变量(点数少)

6、回归画图:(画散点图和拟合直线图)连续值

推荐:lmplot 画散点图和拟合直线图

三个变量(画两条线,(两个连续画点,一个离散分类))

四个变量(多个图显示)

7、多变量之间的关系(一个连续一个离散变量)推荐散点蜂图

三个变量(用颜色区分,两个离散,一个连续)

8、盒图,小提琴图

小提琴图

9、显示值的集中趋势可以用条形图

10、 点图可以更好的描述变化差异

11多重面板:(整合前面的)

12、FacetGrid(干的事情和前面一样,新的方式吧,这个好像很牛逼)

13、热力图(一共三列数据)做成表格

 

可视化使用的数据格式均使用dateframe格式

0、seaborn包基本使用 import seaborn as sns import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt def sinplot(flip=1): x = np.linspace(0, 14, 100) for i in range(1, 7): plt.plot(x, np.sin(x + i * .5) * (7 - i) * flip) 画图之前先设置画图的风格:'''5种主题风格darkgrid whitegrid dark white ticks'''下面语句只能选择一个风格 sns.set_style("whitegrid") #更喜欢这种风格 ,使用sns设置plot画图的风格,但是并没有画图。 # sns.set() # 设置默认值风格 # sns.set_context("poster") # "paper" "talk" "poster" "notebook" 这个指定线条粗细的越来越粗 sns.set_context("notebook", font_scale=1.5, rc={"lines.linewidth": 2.5}) #font_scale坐标轴数字大小 rc:线条大小 sns.despine() #设置 plt.figure(figsize=(8, 6)) #设置图像长宽大小,长8,宽6 画图: sinplot() sns.boxplot(data=data) 画完图设置边界线(去掉上、下左右、边界线): sns.despine() # 默认去掉右边和上边的边界线,sns.despine(left=True)这样写是去掉左边的边界线 显示图像: plt.show() 对于子图中不同的图像设置不同的风格:用with ,with相当一个域,类似于函数域 with sns.axes_style("darkgrid"): plt.subplot(211) sinplot() plt.subplot(212) sinplot(-1) 关于颜色的选取:离散的颜色, current_palette = sns.color_palette() # 默认颜色, sns.palplot(sns.color_palette("hls", 8)) #'hls'是一个系统的颜色空间返回8种不同的颜色 sns.palplot(sns.hls_palette(8, l=.7, s=.9)) # hls_palette()函数来控制颜色的亮度和饱和 l-亮度 lightness ,s-饱和 saturation sns.palplot(current_palette) # palplot用来画图的,参数是颜色 sns.palplot(sns.color_palette("Paired",8)) # 8种颜色,两个两个是一对,深蓝和浅蓝 ... # 使用xkcd颜色来命名颜色 xkcd包含了一套众包努力的针对随机RGB色的命名。产生了954个可以随时通过xdcd_rgb字典中调用的命名颜色。 plt.plot([0, 1], [0, 1], sns.xkcd_rgb["pale red"], lw=3) plt.plot([0, 1], [0, 2], sns.xkcd_rgb["medium green"], lw=3) plt.plot([0, 1], [0, 3], sns.xkcd_rgb["denim blue"], lw=3) 关于颜色的选取:连续渐变的颜色 sns.palplot(sns.color_palette("Blues")) # 正常是离散的传入参数就变成连续的了 由浅到深 sns.palplot(sns.color_palette("BuGn_r")) # 由深到浅,如果想要翻转渐变,可以在面板名称中添加一个_r后缀 sns.palplot(sns.light_palette("green")) #由浅到深 sns.palplot(sns.dark_palette("purple")) # 由深到浅, sns.palplot(sns.light_palette("navy", reverse=True)) # 由深到浅, sns.palplot(sns.color_palette("cubehelix", 8)) ---------------------------------------------------------------------------------- 画图:单特征使用直方图好用,2个特征使用散点图好 --特征就是变量 x = np.random.normal(size=100) x是100个随机数字 sns.distplot(x,kde=False) #这个函数是画直方图或者柱状图,在特定区间中有多少个数字 ,分成默认个区间 sns.distplot(x, bins=20, kde=False) #指定分成20个区间 x = np.random.gamma(6, size=200) from scipy import stats, integrate sns.distplot(x, kde=False, fit=stats.gamma) # 用曲线拟合一下,用到了scipiy这个库 2变量 举例 数据量比较小用散点图 mean, cov = [0, 1], [(1, .5), (.5, 1)] data = np.random.multivariate_normal(mean, cov, 200) df = pd.DataFrame(data, columns=["x", "y"]) sns.jointplot(x="x", y="y", data=df); #这个是画出来x和y的三点图,又画出来每一个变量的直方图 数据量比较大,不能用散点图了,看不了,用半透明的图,kind="hex" x, y = np.random.multivariate_normal(mean, cov, 1000).T with sns.axes_style("white"): 设置风格 sns.jointplot(x=x, y=y, kind="hex", color="k") 3个以上个变量怎么办?我要看两两变量之间的散点图,单个变量的直方图,这个功能包括了上面的sns.jointplot iris = sns.load_dataset("iris") #导入内置数据集,有4列,也就是4个特征 print(iris) sns.pairplot(iris) ----------------------------------------------- 画回归图:两个变量既画散点图,又画回归图,看看是不是线性关系 例子:regplot 和 lmplot 基本一样,但是开始推荐使用regplot tips = sns.load_dataset("tips") sns.regplot(x="total_bill", y="tip", data=tips) #这里是dateframe格式,也可以是其他的吧,不知道 sns.lmplot(x="total_bill", y="tip", data=tips); # 注意这里两个变量是连续值,如果是离散值就不能用了,很不好看 sns.regplot(x="size", y="tip", data=tips, x_jitter=.05) #x_jitter 在x的点加上小范围的浮动 两个变量有一个是离散值怎么画图:swarmplot 这个好 ,三变量,只不过一个用颜色区分开了 sns.stripplot(x="day", y="total_bill", data=tips); #这么画太丑了,不好看,都重叠一起了, sns.stripplot(x="day", y="total_bill", data=tips, jitter=True) #x轴左右摇摆一下分开,好一些 sns.swarmplot(x="day", y="total_bill", data=tips) #这个蜂图感觉更好 sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips) #这个更厉害了,将男女都区别开了,用不同的颜色分开 盒图/小提琴图(用来画离群点的),小提琴图更好 IQR即统计学概念四分位距,第一/四分位与第三/四分位之间的距离 N = 1.5IQR 如果一个值>Q3+N或 


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭