缺失值填补

您所在的位置:网站首页 漏洞太大难以填补的成语是什么 缺失值填补

缺失值填补

2024-07-11 00:27:14| 来源: 网络整理| 查看: 265

期望最大法(expectation maximization,EM)填补是复杂填补方法中的一种,本文实例演示在SPSS软件中实现EM算法填补的操作步骤。

关键词:缺失值; 缺失值类型; 缺失值填补; EM算法; 复杂填补

一、案例介绍

此处仍以缺失情况基本分析一文中生成的缺失数据为例。调查了33名研究对象的性别(gender)、年龄(age)和某生化指标(X),分析性别和年龄对生化指标浓度是否有影响?人为生成一个有缺失值(生化指标缺失10个个案,并且都是在高年龄组缺失)的数据(见图1),然后再进行填补分析。本案例数据可在“附件下载”处下载。

图1 二、回归算法填补 (一) 软件操作

选择“分析”—“缺失值分析”(图2)。

图2

将“年龄”和“生化指标”选入“定量变量”,“性别”选入“分类变量”,勾选“EM”(图3)。

图3

点击“变量”,进入“缺失值分析:EM的变量以及回归”对话框 ,选择“使用所有定量变量”。此处默认情况下为使用所有定量变量进行估计。如果不希望这样做,可以选择“选择变量”,将因变量(缺失变量)选入上方的“预测变量(D)”框,将自变量选入下方的“预测变量(R)”框。如果一个变量可以同时成为因变量和自变量,此时可以使用中间的“两者”按钮将其同时选入两个框(图4)。

图4

点击“EM”,进入“缺失值分析:EM”对话框,其中的“分布”框用于设置变量的分布形式,默认为正态分布。可以更改为混合正态分布或者t分布。后两种情况需要进一步设定相应的参数,如混合正态分布中的混合比例、标准差比以及t分布中的自由度(图5)。“保存完成的数据”复选框用于要求替换后的数据集生成新的数据集。

最后可生成一个新的数据集“EM算法填补”,可在“附件下载”处下载比较。

图5 (二)效果比较

替补后可出现Little’s MCAR检验,结果为无效假设(P=0.018),认为数据缺失不是完全随机缺失。

图6

对数据集“EM算法填补”进行重新分析,然后与缺失值填补——回归算法填补法(链接)分析结果进行对比见表1。

表1

表1

通过对比可知,EM算法只比“序列平均值”效果好,与其他几种方法相比并未体现出明显优势。

我要纠错 End


【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭