对csv文件进行计算出一列数据的平均值、最大值和最小值,以及对应的箱式图 | 您所在的位置:网站首页 › pandas读取csv文件的某一列 › 对csv文件进行计算出一列数据的平均值、最大值和最小值,以及对应的箱式图 |
1.导入模块 import pandas as pd import matplotlib.pyplot as plt2.读取csv文件 读取文件csvin data = pd.read_csv('catering_sale.csv')结果:
3.计算销量的最大值、最小值和平均值 print(data) #1.求销量的最大值、最小值、平均值 sales_volume_max=data['销量'].max() print('最大值\n',data[data['销量']==sales_volume_max]) sales_volume_min=data['销量'].min() print('最小值\n',data[data['销量']==sales_volume_min]) sales_volume_mean=data['销量'].mean() print('平均值\n',sales_volume_mean)
4.获取缺失的数量以及样本总量 #2.求缺失值 data['销量'].isnull() n=data['销量'].shape[0] -data['销量'].count() print('样本总数',data['销量'].shape[0]) print('缺失值的个数',n)
5.对销量进行数据分析给出相应的箱式图 #3.数据分析图 #解决中文乱码 plt.rcParams['font.sans-serif'] = ['KaiTi'] # 指定默认字体 plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题 fig,axes = plt.subplots() data.boxplot(column='销量',ax=axes) # column参数表示要绘制成箱形图的数据,可以是一列或多列 axes.set_ylabel('sales_volume of data') fig.savefig(r'输出图片')
|
CopyRight 2018-2019 实验室设备网 版权所有 |