matplotlib 绘制直方图 | 您所在的位置:网站首页 › matplotlib直方图平衡 › matplotlib 绘制直方图 |
1.直方图
直方图是用一系列不等高的长方形来表示数据,宽度表示数据范围的间隔,高度表示在给定间隔内数据出现的频数,长方形的高度跟落在间隔内的数据数量成正比,变化的高度形态反映了数据的分布情况。 2.导入相关库Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 我们一般用到的是 Matplotlib 的 Pyplot 函数集合。 from matplotlib import pyplot as pltPyplot 中使用 hist( ) 绘制直方图,并以元组形式返回直方图的计算结果,包括各区间中元素数量,区间的取值范围,以及具体每个区间对象。 3.相关参数介绍 hist( x, bins=None, range=None, normed=False, # 超重要 density=False, weights=None, cumulative=False, bottom=None, histtype='bar', align='mid', rwidth=None, # 选用 orientation='vertical', color=None, edgecolor=None, label=None, # 常用 stacked=False, **kwargs)x x x:数组或者数组序列(不要求每个数组长度相同),用于存放数据 b i n s bins bins:整数、序列或字符串,整数表示等宽区间的个数(直方图条形个数),自动计算区间范围,序列则表示区间的范围,除了最后一个以外,都是包含左边不包含右边,字符串则表示对应的策略,默认为 hist.bins r a n g e range range:元组,指定最小值和最大值(直方图数据的上下界),默认包含绘图数据中的最小值和最大值(默认以绘图数据的最小值作为直方图数据的上下界) n o r m e d normed normed:是否将直方图的频数转化为频率 d e n s i t y density density:布尔值,可选,如果为 True,则返回的是归一化的概率密度,所有区间的概率之和为1 w e i g h t weight weight:类似于数组的值,可选,形状和 x x x 相同,表示每个值对应的权重,默认情况下所有数据的权重相同 c u m u l a t i v e cumulative cumulative:布尔值或 -1,累积求和,表示小于某个数的所有元素个数之和,随着数的增大而不断增大,如果为 -1,则反转方向,表示大于某个数的所有元素个数之和,随着数量增大而不断减小 h i s t t y p e histtype histtype:指定直方图的类型,默认为 bar。bar(多个并列摆放),barstacked(多个堆叠摆放),step(生成对应的折线),stepfilled(填充相关区域) a l i g n align align:设置条形边界值的对齐方式,默认为 mid,另外还有 left 和 right r w i d t h rwidth rwidth:设置条形图的宽度 o r i e n t a t i o n orientation orientation:设置直方图的摆放方向,默认为垂直方向。 c o l o r color color:设置直方图的填充色 e d g e c o l o r edgecolor edgecolor:设置直方图边框色 l a b e l label label:设置直方图标签,可以通过 legend 展示其图例 s t a c k e d stacked stacked:当有多个数据时,是否需要将直方图呈堆叠摆放,默认水平摆放 4.绘图示例这里以我自己正在做的一个问题为示例,至于其他参数,大家不妨自己去尝试使用一下。 绘图数据:
此时的区间划分和各区间频数为: 修改部分参数: plt.figure(figsize=(20,10)) matplotlib.rcParams['font.family'] = 'SimHei' fre_tuple = plt.hist(id_array, bins=20, color='steelblue', edgecolor='black', rwidth=0.8, orientation='horizontal') plt.title('小区流量记录分布直方图', fontproperties='SimHei', fontsize=15) plt.show()修改 bins 参数,自定义划分区间: plt.figure(figsize=(20,10)) matplotlib.rcParams['font.family'] = 'SimHei' bins = np.linspace(0,1200,13).tolist() bins.append(2500) fre_tuple = plt.hist(id_array, bins=bins, color='steelblue', edgecolor='black', rwidth=0.8, orientation='horizontal') plt.title('小区流量记录分布直方图', fontproperties='SimHei', fontsize=15) plt.show()修改后的 bins: 此时的区间间隔和频数: |
CopyRight 2018-2019 实验室设备网 版权所有 |