R语言数据处理之选择特定的列
R语言数据处理是一个繁琐的过程,需要不断对数据进行选择,清洁处理。面对一个多特征列的数据集,如何快速的选择我们需要的列的数据,是一个需要磨练的过程。
今天学习的过程中,学习到了几个简单的函数,在这里总结一下并和大家分享一下。
tidyverse包相信大家都不陌生,其中dplyr包中的select()函数可以根据列名,列所在的位置对特定的一列或多列数据进行选择并提取出来,当然这个过程需要我们知晓列的具体名字或者具体的位置,如果我们只知道模糊的关键词,这时候需要去colname()或者view()查看具体的列名,较为麻烦。此外,我们需要选择多个具有共同特点的列时,逐一选择,需要不断地view(),不能偷懒,这个时候,今天学习的函数将会帮助我们更加便捷的选择特定的列。
先让我们一起看看这几个函数
![在这里插入图片描述](https://img-blog.csdnimg.cn/4d2bf149d2f04317ab00d355af891b5f.png)
其中,starts_with(),ends_with()以及contains()是提取列名中特定元素的方式,matches()函数是表达式选择的方式。
接下来对几个函数的运用进行代码练习
require(tidyverse)#加载包
require(dplyr)#加载包
install.packages('tidyr')
require(tidyr)
data |