全文预览

SPSS聚类的分析具体操作步骤

上传者:塑料瓶子 |  格式:ppt  |  页数:20 |  大小:250KB

文档介绍
对变量的聚类称为R型聚类? 对观测值聚类称为Q型聚类? 这两种聚类在数学上是对称的,没有什么不同。?(二)按聚类的方法分类? 分层聚类或系统聚类分析? 快速聚类分析? 两步聚类分析:新型的Р事先不用确定分多少类:分层聚类Р分层聚类或系统聚类(hierarchical cluster)。开始时,有多少点就是多少类。?它第一步先把最近的两类(点)合并成一类,然后再把剩下的最近的两类合并成一类;?这样下去,每次都少一类,直到最后只有一大类为止。显然,越是后来合并的类,距离就越远。再对饮料例子来实施分层聚类。Р对于一个数据,人们既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。?比如学生成绩数据就可以对学生按照理科或文科成绩(或者综合考虑各科成绩)分类,?当然,并不一定事先假定有多少类,完全可以按照数据本身的规律来分类。Р快速聚类Рk-均值聚类(k-means cluster,也叫快速聚类,quick cluster)却要求你先说好要分多少类。看起来有些主观Р假定你说分3类,这个方法还进一步要求你事先确定3个点为“聚类种子”(SPSS软件自动为你选种子);也就是说,把这3个点作为三类中每一类的基石。Р然后,根据和这三个点的距离远近,把所有点分成三类。再把这三类的中心(均值)作为新的基石或种子(原来的“种子”就没用了),重新按照距离分类。Р如此叠代下去,直到达到停止叠代的要求.Р适合处理大样本数据。Р特点?聚类分析前所有个体所属的类别是未知的,类别个数一般也是未知的,分析的依据只有原始数据,可能事先没有任何有关类别的信息可参考?严格地,聚类分析并不是纯粹的统计技术,不象其他多元分析,需要从样本去推断总体?一般不涉及统计量分布,也不需显著性检验?聚类分析更象是一种建立假设的方法,而对相关假设的检验还需要借助其他统计方法

收藏

分享

举报
下载此文档