r语言读入中国的统计年鉴excel数据时,如何处理变量名?现自编三个函数,供大家参考。 您所在的位置:网站首页 rstudio读取表格 r语言读入中国的统计年鉴excel数据时,如何处理变量名?现自编三个函数,供大家参考。

r语言读入中国的统计年鉴excel数据时,如何处理变量名?现自编三个函数,供大家参考。

2022-12-27 05:54| 来源: 网络整理| 查看: 265

一、主要问题

用excel打开一般的官方“统计年鉴”的数据,一般出现下面的形式(这里只举一例,其它情况类似,大家可仿此处理)。 图一这个表格要读入R语言处理,遇到的第一个问题就是如何按变量名称来读入数据。表格中,“年份”变量可直接读入,“年末户籍总人口(万人)”等变量可直接读入,但是像第一产业、第二产业、第三产业等,就不是那么方便了。因为这些变量一是处于不同的行,二是相同的变量名称出现多次,而且“国内生产总值”这个名称,是“第一产业”,“第二产业”等变量的前缀。所以,必须进行处理。

那么,如何处理呢?你可以在excel中手动修改,但是这样做太过笨浊了,因为当数据量很大的时候,基本上很难办到。所以本文偿试用编程的方法来处理这个问题。下面分步介绍。

二,如何处理

我们先加载两个包:

library(stringr)#处理字符串需要用到 library(xlsx)#读入excel文件时要用到 library(tidyverse) 1、直接读入数据

这里,我们先将原始数据读入Rstudio,然后编程处理。读入的时候,使用XLSX程序包。我用下面这段代码读入原始数据。读入时,不包含变量名,直接把变量名读入为数据。数据的标题不读入(也可读入后删除)。

setwd("C:/Users/caozhaowen/Desktop/南充市统计年鉴2021/南充统计年鉴2021年") 南充历年主要经济指标 if (!is.na(b[[i]][1])){ stand_by[i]="" }else if(is.na(b[[i]][1])&(!is.na(b[[i-1]][1]))){ stand_by[i]


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有