一文彻底讲透聚类分析(基于SPSS软件实现) 您所在的位置:网站首页 spss男女分组 一文彻底讲透聚类分析(基于SPSS软件实现)

一文彻底讲透聚类分析(基于SPSS软件实现)

2023-05-04 14:16| 来源: 网络整理| 查看: 265

聚类分析到底是啥玩意?听起来高大上???

其实,聚类分析并不高深。有一句话大家耳目娴熟:人以类聚,物以群分。

聚类分析又称为群分析,是分类学的一种基本方法。所谓 类,通俗的讲,即是由具有相似性元素构成的集合。聚类分析也是多元统计学中应用极为广泛的一种重要方法。

分类问题在经济,医学及科学研究中十分常见,如超市商品的种类繁多,需要根据商品的用途,价格档次及产地等多方面的变量因素分成不同的组别,仅仅利用单变量因素分布不足以全面且综合地描述商品的类别。应多种因素同时考虑并对不同品种之间的关系给出定量化的描述,然后制定分组规则,按照实际的需要分类可以利用聚类分析的方法。

聚类分析是一种解释数据的方法,要得到一个客观且综合的聚类分析结果必须经过多次不同方法实验。

SPSS里提供了两种具体的聚类方法:K-中心聚类和系统聚类。

K-中心聚类:也叫K均值聚类,此过程根据MacQueen算法。K中心聚类适用于较大表,多达几十万行。首先K均值聚类将对聚类种子点进行一个非常完善的预测,然后开始迭代。交替执行两个操作,即将点指定给聚类和重新计算聚类中心。用户必须指定聚类数,然后才开始这一过程。当明确所需要分出的类别数时,采用快速聚类可以节省运算时间,其次该方法只能对样品聚类而不能对变量聚类、所使用的变量必须都是连续性变量。

系统聚类:也叫分层聚类法,变量聚类的作用之一是减少变量的维度。可以对样品聚类,也可以对变量聚类,变量可以是连续性或分类变量。

K-中心聚类应用思想:

是先将n个观察单位分为K类,并确定K个初始类中心,然后根据距类中心最小欧氏距离原则,采用迭代方法,对样品进行归类。具体做法如下:

(1)按照指定的希望分类的数量,按某种原则作为今后各类的初始核心;

(2)按就近原则将其余观测向凝聚点凝集,这样得到一个初始分类方案,并计算出各个初始分类的中心位置(均值);

例题:对20个样品进行聚类分析。

结果解读:样品分类结果

结果解读:样品1,5,16聚为第一类;样品8,9,17,19聚为第二类;样品3和11,13聚为第三类;样品2,4,6,7,10,12,14,15,18,20聚成第四类。

主要输出结果:ANOVA分析

对数据进行了聚类,但是,所用的变量都对分类有贡献吗?引入了无关变量,则会降低聚类的效果,甚至会导致错误的分类结果。为此,可以使用Options子对话框中的ANOVA Table复选框进行单因素方差分析,以考察三个变量在类间是否有差异。结果显示,x1、x2、x3在四类间的均数均有差异。

系统聚类应用思想:

将n个样品或变量看成不同的n类,然后将距离接近(针对样品聚类)或性质接近(针对变量聚类)的两类合并为一类;再从这n-1类中找到最接近的两个类合并,以此类推,直到所有的样品或变量被合为一类。整个过程可以绘成聚类图,按图和具体问题来决定分类。

案例:有10名学生参加测试,测试10个指标,试对这十个指标进行聚类:

冰柱图结果解读:

冰柱图应从图片的最下端开始分析。在冰柱图的最下端,样本长条对应的纵坐标为10,表示在聚类过程中,首先将10个样本划分为9类,类与类之间由白色间隙间隔开。总共8个白色间隙,分隔为9类.

树状图:纵坐标刻度表示距离。读懂树状图,你需要一把尺子,与从左向右的横线垂直90度放下。此时,横线(一条线就是一个类别)被尺子截断,这些端点的个数就是该相对距离下的类别数目。

小结:不管是冰柱图还是树状图,它更多的是为我们充分展示聚类的整个过程,让我们从可视化的层面了解到哪些个案被归聚为一类,最终聚为几个类别,这需要你依据对不同类的特征的区隔程度来讨论决定。本章摘自尚西老师原创的25集SPSS视频教程,索取免费案例素材请联系尚西老师(请叫我雷锋哈)。

SPSS课件

说实话,统计学一般人是望而生畏,主要不是公式的推演,因为复杂的公式计算现在都是借助计算机软件如SPSS、MINITAB等,会操作工具就可以。难度在于原理的掌握,比如上述聚类分析,SPSS里鼠标操作看起来特别简单,但是结果如何解读呢?这就需要对统计学理论和方法有一个系统化的认识,除了视频学习实操,想深入学习理论知识,建议买一本书看看,不要贪多,一本就够,下面这三本书个人觉得蛮不错的,价格也不贵,不能说很好,但是这三本书对统计学菜鸟比较友好,厚度适中,不会吓坏大家(统计学书籍普遍较厚较贵,难度也挺大)。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有