宽数据转长数据的几个方法 您所在的位置:网站首页 spss数据转成excel 宽数据转长数据的几个方法

宽数据转长数据的几个方法

2023-07-29 22:28| 来源: 网络整理| 查看: 265

长数据与宽数据 长数据

变量少而观察值多。数据集中的变量没有做明确的细分,变量中有一个或多个变量值存在重复的情形

图1.长数据样式 国家和年度两个变量,大量重复,一列观察值 宽数据

变量多而观察值少。数据集对全部变量进行了细分,各变量的值无重复循环的情况

图2.宽数据样式:21个变量,国家和2000年到2019年,每个变量一列数据 为什么要进行数据表转化

为了数据分析处理的需要,如在R软件中,通常使用长数据形式进行,而在Minitab,SPSS等软件中,通常使用宽数据更容易处理。

转换方法

转换方法很多,SPSS,Minitab和R等常用软件都能实现。本文重点介绍使用EXCEL(使用Power Query),在R,Minitab中转换方法,后边的文章中再另行介绍。 本文案例数据为肉哥整理的20年来各国入选世界500强的企业数表格清单41行21列* 1. EXCEL中转换 在EXCEL中,使用EXCEL自带的PowerQuery插件,可快速实现。具体方法如下:

打开EXCEL,新建工作表,依次选择“数据”-“获取数据”-“自文件”,根据数据存储形式选择对应的文件,本文待处理数据存储为csv文件,所以选择“从文本/csv(T)”路径选择待处理数据。(见图3所示) 也可以直接在EXCEL中打开待转换的数据表,在“数据”-“自表格/区域”中选择待转换的数据,后续操作方法一致。

图3 选择宽数据文件

选择文件后,点击“转换数据”按钮,进入PowerQuery界面

图4.使用PowerQuery处理数据 图5.PowerQuery界面下的数据

数据第一行应该是列标题,即我们通常说的变量名,但在这个表中却被处理为观测值,需要对数据进行处理,把数据第一行设置为列标题,操作方法,依次点击“主页”-“将第一行用作标题”,设置完成后,第一行变为行标题,即可进行数据转换

图6.设置数据行标题 图7.行标题已设置完成,图5中第2行数据在表中已变为第1行

-对数据进行“逆序透视”操作,完成宽数据转变为长数据(说明,我们在EXCEL中采插入数据透视表,其过程即为长数据转宽数据的过程,而宽数据转长数据,即为数据透视的逆操作,在PowerQuery中称为“逆序透视”);操作方法:选中“country”列(默认状态即为选择该列,实际操作中无需额外操作)依次选择“转换”-“逆序透视”-“逆序透视其他列”,逆序透视后,数据表只有三列,宽数据转长数据操作完成

图8.逆序透视宽数据,实现转换为长数据 图9.转换后的长数据表格 -更改图9中第二列,第三列标题名称,第二列为“年度”,第三列为“500强企业数”,依次选择“主页”-“关闭并上载”,数据即上载到EXCEL中。 图10.关闭并上载数据 图11 EXCEL中的长数据表

至此,图2宽数据已转换为图11显示的长数据格式,总共624行数据。 原数据41行*21列,转换后只有624行,即624组数据,数据总量减少了,因为原始数据表中有空值,而这个空值存在很大的坑,后边使用Minitab和R原件操作时,就能发现。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有