Stata数据处理:统计组内非重复值个数 |
您所在的位置:网站首页 › 七堇年作品特点 › Stata数据处理:统计组内非重复值个数 |
全文阅读:https://www.lianxh.cn/news/3f5d25925cd54.html 目录 方法一:使用 _n 和 egen 命令的 tag() 函数方法二:使用 egenmore 命令的 nvals() 函数 2.1 下载安装2.2 语法结构2.3 应用范例方法三: distinct 命令 3.1 下载安装3.2 语法结构3.3 命令使用4. 结语Note: 本文对命令的介绍基于 Nicholas J. Cox, Speaking Stata: Distinct observations, The Stata Journal (2008) 8, Number 4, pp. 557–568. PDF。 本文以系统自带数据 auto.dta 进行介绍,如何识别一个变量或者一个数据集中有多少种不同的观察结果。例如,公司 在第 年发生了 30 多笔借贷业务,我们想知道这些业务涉及了多少家银行。 目前在 Stata 中有不少命令都可以处理这个问题,比如 contract , duplicates ,但这些命令在实现过程都破坏了原有的数据结构。在这里,我们推荐两种方法,一种是使用 egen 命令自带的 tag() 函数来标记非重复值的出现与否,进而使用 total() 或 sum() 函数进行加总;另一种方法是直接使用外部命令 egenmore 提供的 nvals() 函数。 全文阅读:https://www.lianxh.cn/news/3f5d25925cd54.html |
今日新闻 |
点击排行 |
|
推荐新闻 |
图片新闻 |
|
专题文章 |
CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭 |