python大作业500行代码 |
您所在的位置:网站首页 › 设计报告题目有哪些 › python大作业500行代码 |
大家好,小编来为大家解答以下问题,python大作业有哪些题目,python大作业设计报告,现在让我们一起来看看吧! 大家好,小编为大家解答python大作业代码及文档的问题宿迁趣品网络。很多人还不知道python大作业有哪些题目,现在让我们一起来看看吧! Python数据分析与应用大作业使用学习过的知识(Numpy数值分析基础、Matplotlib数据可视化基础、Pandas统计分析基础),对用户用户用电量数据进行相关处理,其中数据中有编号为1-200的200位电力用户,DATA_DATE表示时间,如2015/1/1表示2015年1月1日,KWH为用电量。请完成以下工作: 一、将数据进行转置,转置后行为用户编号、列为日期、值为用户每日用电量ai伪原创api,如何用php调用。 二、对数据中的异常数据进行识别并处理。 三、统计每个用户用电数据的基本统计量,包括:最大值、最小值、均值、中位数、和、方差、偏度、峰度。 四、每个用户用电数据按日差分,并求取差分结果的基本统计量,统计量同三。 五、求取每个用户的5%分位数。 六、每个用户按周求和并差分(一周7天,年度分开),并求取差分结果的基本统计量,统计量同三。 七、统计每个用户的日用电量在其最大值0.9倍以上的次数。 八、求取每个用户日为最大值/最小值的索引月份,若最大值/最小值存在于多个月份中,则输出含有最大值/最小值最多的那个月份。如1号用户的最小值为0,则看哪个月的0最多。 九、求取每个用户七八月电量和与三四月电量和的比值,最大值的比值,最小值的比值,均值(日均电量)的比值。 十、合并上述特征。 一、将数据进行转置,转置后行为用户编号、列为日期、值为用户每日用电量 import pandas as pd data = pd.read_csv('', encoding='gbk') # 转置data # result = data.reset_index().pivot('CONS_NO', 'DATA_DATE', 'KWH') data['DATA_DATE'] = pd.to_datetime(data['DATA_DATE']) result = pd.pivot_table(data, index='CONS_NO', columns='DATA_DATE') print(result)导入pandas,导入文件同时编码设置为GBK,把DATA_DATE转换为时间序列,使用透视表将index设置为'CONS_NO',columns设置为'DATA_DATE'。 注意:若此处不把DATA_DATE转换成时间序列,那么columns的排列顺序将不是按照时间顺序,而是按照数字顺序。例:未转换时,顺序为2015/1/1, 2015/1/10, 2015/1/11 , ...;转换后,顺序为2015/1/1, 2015/1/2 , 2015/1/3 , ...。 二、对数据中的异常数据进行识别并处理 # 异常值识别处理 null_value = data.isnull().sum() # 缺失值识别 print("data具有的缺失值:\n",null_value) data.fillna(method='pad', inplace=True) # 缺失值处理方法:用前一个数据进行填充 null_value = data.isnull().sum() print("data处理缺失值之后:\n",null_value) u = data['KWH'].mean() o = data['KWH'].std() three_uo = data['KWH'].apply(lambda x: x>u+3*o or x |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |