18 您所在的位置:网站首页 spss数据计算处理 18

18

2023-03-14 16:17| 来源: 网络整理| 查看: 265

异常值是数据集中距离大多数数据明显较远的数据。数据录入错误、编码错误、缺失值定义错误、测试操作失误、特殊个案等因素都会产生异常值。异常值往往会对分析结果产生较大的影响。

在单个变量上的明显偏高或偏低的值称为单变量异常值;在两个或多个变量的组合上异常的值称为多变量异常值。

采用SPSS查找异常值的常用方法:“数据”菜单中的“标识异常个案”、“数据有效性的验证”、“个案排序”;“图形”菜单“图表构建器”中的“直方图”、“箱图”(用“O”和“*”标注的数据)、“散点图”(明显偏离的点);“分析”菜单“描述统计”中的“频率”和“交叉表”。具体操作方法请查看往期发文。

2.异常值的处理

查找到异常值以后首先要通过查阅原始资料或数据集,找到异常值产生的原因,如果是录入错误、编码错误或缺失值定义错误等,可以重新录入、编码或定义;如果是测试操作失误,可以重新测试;如果已经无法弥补错误,可以考虑剔除;如果是特殊个案造成的,比如测量身高时,只有一人身高为2.25米,其他人身高都在1.90米以下,那么要从研究目的出发,考虑特殊个案是否具有研究价值,如果有研究价值可以保留,如果没有研究价值可以剔除。当异常值需要保留时,经常采用“重新分组”或“改变计分”等办法降低异常值对分析结果的影响。比如,把身高1.8米以上的合并为一组,把肺活量数值大于的都评价为100分。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有