nhanesR:数据文件查找 |
您所在的位置:网站首页 › nhanesr包食物摄入组 › nhanesR:数据文件查找 |
NHANES数据库有许多许多许多文件数,本节我们将了解NHANES文件分布,并教大家如何查找想要的文件,查找到目标文件,是数据读取的第一步。 写本次教程的日期是2021-08-08。 NHANES是按年保存数据的,从1999年开始每2年更新一次,每年数据都有5个项目:Demographics、Dietary、 Examination、 Laboratory、 Questionnaire。 在年度方面,1999-2000年有119个数据文件,最少的是2017-2018年,只有107个数据,最多的是2013-2014年,有180个数据。目前2019-2020年还在更新中,只有25个数据。平均每年有大约140个数据左右。 在5大项目方面,Demographics数据量最少,Laboratory数据量最多。Demographics每年只有1个数据,Dietary在1999-2000和2001-2002这两年都有8个文件,而后面基本都有15个文件,因为自2003年开始,表格的设计发生了变化。 在读取数据之前,需要先查询到我们需要的数据,在nhanesR包中,我们提供了nhs_files_pc()命令来查询本地数据库的文件,在nhs_files_pc()命令中,有以下几个重要参数。 •years:年份,默认所有所有年份 •items:5大项目,忽略大小、左匹配、默认所有项目 •pattern:文件名中包含的字符 •file_ext:文件扩展名,默认是所有类型文件,用于后续的数据读取。 现在,我们要找到所有年份的人口学数据demo •没有赋值years和items表示在所有年和项目文件中查询 •将demo赋值给pattern,表示在所有文件名中查询包含demo的文件名 •将tsv赋值给file_ext表示文件扩展名为tsv 查询结果共有11个,是自1999年到2020年的全部11个人口学数据文件。 当然,也有一些特殊的文件类型,比如pdf和sas7bdat文件。 |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |