Windows 10 您所在的位置:网站首页 年龄段分析图怎么做 Windows 10

Windows 10

2024-06-30 23:34| 来源: 网络整理| 查看: 265

最近需要用到条形图,统计年龄,所以查了一下资料,修改为满足自己要求的条形图,下面看代码自行领会。

测试环境:

操作系统: Window 10 工具:Pycharm Python: 3.7 matplotlib: 3.5.1 pandas: 1.3.5 numpy: 1.21.6

Virtualenv 虚拟环境下安装 matplotlib、pandas

pip installl matplotlib pip installl pandas

test.xlsx 文件配置链接: Windows 10 - Ptyhon - 数据分析 - Openpyxl 导入Excel

代码演示:

#!/usr/bin/env python # -*-coding:utf-8-*- import matplotlib.pyplot as plt # 导入库 import os import pandas as pd import numpy as np PATH = os.path.abspath('.') # . 表示当前所处的文件夹的绝对路径, .. 两个点代表上一级的绝对路径 EXCELPATH = PATH + r"\test.xlsx" # excel 文件路径 def paint(): # plt.rcParams['font.sans-serif'] = 'simhei' # 用来正常显示中文(黑体)常用字体包括:楷体: Kaiti # # 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei df = pd.read_excel(EXCELPATH,usecols=[2]) print(df) print(df.info()) # 获取 DataFrame 的摘要 print(df.head()) # 根据位置返回对象的前n行信息(默认值为5) ,用于快速测试数据集 print(df.describe()) # 生成描述性统计数据,总结数据集分布的集中趋势,分散和形状,不包括 NaN值。 # 数据预处理 data = df.dropna(axis=0) # 删除所有包含空值的行,0 是行,1 是列 print(data.info()) print(data) x = data["年龄"] print(data.describe()) # 查看最大值与最小值 bins = np.arange(10, 50, 5) # 这里是 10 - 45 岁之间,间隔为 5 岁 time_bins = pd.cut(x, bins) # 对数据进行离散化处理 print(time_bins) df1 = data.groupby(time_bins)["年龄"].count() print(df1) # 绘制图形 df1.plot(kind="bar", rot=0) plt.rcParams['font.sans-serif'] = ['Kaiti'] # 用来正常显示中文(黑体)常用字体包括:楷体: Kaiti # 仿宋: FangSong 微软雅黑: Microsoft YaHei 黑体: SimHei plt.rcParams['axes.unicode_minus'] = False #运行配置参数总的轴(axes)正常显示正负号(minus) plt.show() # 调用年龄统计方法 paint()

参考链接:

统计年龄分布情况(5岁的间隔统计),绘制出年龄分布图。

pandas plot参数

【matplotlib】plot()kind参数表

plt.rcParams[‘font.sans-serif‘] = [‘SimHei‘] 和plt.rcParams[‘axes.unicode_minus‘] = False



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有