聚类分析(用spss实现)
的有关信息介绍如下:聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
聚类分析的描述
【分析】-【分类】-【k-平均值聚类】,进行相关参数的设置
结果显示:spss从中挑选了几个个例
5个聚类中心选择了5个原始案例
针对存在的问题,进行相关参数的设置,增加迭代次数。。足够的迭代后,已经收敛,但还存在一个问题是:各聚类的效果不明显
主要是原始数据中差别有点大
所以要对数据进行标准化,得到标准化后的结果。
利用标准化后的数据进行聚类分析
结果看起来比较别扭
接着进行【分析】,【比较平均值】
3395个样本中有443个
1,2,3,4,5类各具有特点
结果
对变量做聚类分析
结果:
第二张图中的横轴“25”对应“凝聚计划”表系数(距离)中的最大值233.297依次换算即可
这个聚类结果不太合理
----------------------换方法
换方法
结果合理!
个案聚类,这个过程会自动处理缺失值,使得整体数据更加服从适用条件,也就是【两步聚类】
结果被 聚为两类
需要注意的事项:数据预处理:许多变量有强的共线性可以提取公因子,个别变量有共线性可以删除其中一个次要的变量,或者把它俩相加或平均组合成一个次要的。两步聚类可以自动处理异常值,把异常值单独归为一类。
其他方面