【Educoder数据挖掘实训】了解数据 您所在的位置:网站首页 材料工程基础第三章 【Educoder数据挖掘实训】了解数据

【Educoder数据挖掘实训】了解数据

2024-06-11 09:06| 来源: 网络整理| 查看: 265

【Educoder数据挖掘实训】了解数据

开挖

T1 数据集中有多少条数据?

按题目直接输出行数即可

import pandas as pd df = pd.read_csv("deaths.csv") #### Begin #### print(df.shape[0]) #### End #### T2 查看数据中的列名

题目里给了 h e a d head head是看前几列, t a i l tail tail是看后几列。而且我们通过输出 h e a d ( ) head() head()发现会将列名输出。故此我们直接输出 h e a d ( 0 ) head(0) head(0)即可。

import pandas as pd df = pd.read_csv('deaths.csv') #### begin #### print(df.head(0)) #### end #### T3 选择属性的类型

关于数据类型只需要本地输出一下 t y p e type type即可。

import pandas as pd df = pd.read_csv("deaths.csv") print(df.head()) print(df.values[0][5]) print(df.values[0][2]) print(type(df.values[0][5])) print(type(df.values[0][2]))

答案: D D C C C B T T DDCCCBTT DDCCCBTT

T4 查看每个属性的类型

扫一遍一个一个输出,看一眼标准输出的格式即可。

import pandas as pd df = pd.read_csv('deaths.csv') data = pd.DataFrame(df) data = data.iloc[1,:] #### begin #### ans = [] for d in data : ans.append(type(d)) print(ans) #### end #### T5 查看属性的值域

直接输出即可,根据格式可以放在列表里。

import pandas as pd df = pd.read_csv('deaths.csv') data = pd.DataFrame(df) data = data.iloc[1:,1] #### begin #### ans = [min(data), max(data)] print(ans) #### end #### T6 数据集的类型

直接输出 d t y p e s dtypes dtypes即可。

import pandas as pd pd.set_option('display.max_rows', 1000) # 读入外部数据 data3 = pd.read_csv('deaths.csv') #####begin##### print(data3.dtypes) ####


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有