[SPSS]系统聚类和kmeans聚类的spss实现——基于多维度对中国各城市聚类

2023-10-27

一、系统聚类

  1. 选中系统聚类并把变量移入变量框内,聚类选择按照个案聚类

在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。

选中绘图中的谱系图

单击保存选项卡,方案范围选择2到4,显示分为2、3和4类时的结果。

得到的谱系图如下所示:

在变量视图中可以很明显看到个案被分为2、3和4类的情况,其中上海在三种方案中都自成一类,尤其是分为两类并不合适。

二、k-means聚类

1、选择K-means聚类并把变量移入变量框。

   选择聚类数为3且方法选择迭代与分类保证一直计算新的分类中心。

保存选项中同时选中聚类成员和与聚类中心的距离

在选项中选中初始聚类中心和对每个个案的聚类信息,则在输出窗口中将给出聚类的初始类中心和每个观测量的分类信息。

  1. 结果解释:

起始聚集中心给出了初始类的中心。

起始叢集中心

 

叢集

1

2

3

食品

169.92

221.11

104.78

衣着

32.75

38.64

25.11

燃料

12.72

12.53

6.40

住房

47.12

115.65

9.89

交通和通讯

34.35

50.82

18.17

娱乐教育文化

5.00

5.89

3.25

迭代历程显示了经过两次迭代,故两次迭代后中心的变化为0。

疊代歷程a

疊代

叢集中心的變更

1

2

3

1

17.986

.000

16.864

2

.000

.000

.000

 

最终聚集中心显示除了每一类在每个变量标准下的平均值。

最終叢集中心

 

叢集

1

2

3

食品

155.77

221.11

117.16

衣着

32.79

38.64

25.41

燃料

13.96

12.53

11.48

住房

36.15

115.65

19.40

交通和通讯

33.33

50.82

21.89

娱乐教育文化

5.59

5.89

4.23

三、两种方法的比较

1、关于聚类个数:系统聚类和k-means都需要自己选择聚类个数,但是系统聚类可以根据谱系图自己选择分类效果较好的几类。

2、聚类效果比较:

上图是k-means聚类的聚类结果,可以看到上海仍然自称一类,可见对于差异比较大的个案,两种方法都能区分出来,因而聚类效果基本一致。

但是系统聚类能看出各个个案之间关系的远近

  1. 聚类能力比较:

在这个案例中没有体现出来,但是k-means由于计算量少,在处理大样本的时候更加有效率。

 

 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

[SPSS]系统聚类和kmeans聚类的spss实现——基于多维度对中国各城市聚类 的相关文章

  • 7教程统计意义_SPSS进行中介效应检验的实战操作与分析结果详解 ——【杏花开生物医药统计】...

    中介变量 Mediator 是一个重要的统计概念 xff0c 如果自变量X通过某一变量M对因变量Y产生一定影响 xff0c 则称M为X和Y的中介变量 研究中介作用的目的是在已知X和Y关系的基础上 xff0c 探索产生这个关系的内部作用机制
  • SPSS数据分析软件的安装与介绍(附网盘链接)

    x1f935 个人主页 xff1a 64 艾派森的个人主页 x1f3fb 作者简介 xff1a Python学习者 x1f40b 希望大家多多支持 xff0c 我们一起进步 xff01 x1f604 如果文章对你有帮助的话 xff0c 欢迎
  • 使用IBM SPSS Statistics的新手应该如何入门

    一 什么是IBM SPSS Statistics xff1f IBM SPSS Statistics 是一款强大的统计软件平台 xff0c 它所提供的数据分析功能 xff0c 可以帮助企业 个人对各类数据进行切实可行的洞察分析 xff0c
  • SPSS软件实操——ARIMA时间序列预测模型

    相关文章链接 时间序列预测 ARIMA模型 https blog csdn net beiye article details 123317316 spm 61 1001 2014 3001 5501 案例 xff1a 基于ARIMA模型对
  • SPSS(八)logistic回归(图文+数据集)

    SPSS 八 logistic回归 我们之前的线性回归也好 线性回归衍生方法也好 非线性回归也好 因变量的类型都是连续性的 假如因变量的类型是分类的呢 logistic回归针对的是二分类的因变量 logistic回归 基于线性回归模型发展而
  • SPSS实现神经网络(多层感知器)

    目录 1 选用数据集 2 SPSS实现神经网络 1 产生随机数来选择样本数据集 2 生成多层感知器 3 用bankloan sav数据集进行实验 对数据集个体分类 是 否违约 1 选用数据集 实验选用SPSS自带数据集 bankloan s
  • 手把手教你SPSS进行ROC曲线分析

    ROC曲线也叫受试者工作曲线 原来用在军事雷达中 后面广泛应用于医学统计中 ROC曲线是根据一系列不同的二分类方式 分界值或决定阈 以真阳性率 灵敏度 为纵坐标 假阳性率 1 特异度 为横坐标绘制的曲线 ROC曲线主要应用于二分类结局 比如
  • 如何从 SPSS 中的另一个语法文件获取语法文件?

    在 R 中有source函数 您可以从另一个 R 脚本获取 R 脚本 我希望能够在 SPSS 中做同样的事情 如何从另一个 SPSS 语法文件获取 SPSS 语法文件 根据 AndyW 的评论进行了更新 有的是INSERT and INCL
  • 多重响应分析

    df1 lt data frame c male female male c 1 2 3 4 5 6 seq 141 170 names df1 c gender age height df1 age lt factor df1 age l
  • 分析来自谷歌文档表单的多重响应字段

    我用 Google Doc 制作的一份调查问卷有一个多重响应集 假设三个可能的问题是 foo bar foobar 允许人们勾选一个或多个答案 在我的谷歌电子表格结果中 我有 answer1 foo answer2 foo bar answ
  • 从 Python 快速导入自定义 SPSS 命令

    我编写了一个简洁的 Python 模块 其中包含一些自定义 SPSS 函数供我的同事使用 但是 要使用该功能 他们首先需要输入 BEGIN PROGRAM 在实际调用函数之前导入模块等 因为他们中的大多数人并不精通技术 所以我希望让事情变得
  • 有Python模块可以打开SPSS文件吗? [关闭]

    Closed 此问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 Python 是否有用于打开 IBM SPSS 即 sav 文件的模块 如果有不需要任何额外 dll 文
  • Haven::read_sav 显示值标签而不是代码

    我在用着haven导入一个 sav文件到R 我想知道如何显示值标签而不是数字代码 在下面的示例中 我想显示物种名称而不是数字 1 2 3 library haven path lt system file examples iris sav
  • 使用 R 重现 SPSS 因子分析

    我希望有人能指出我正确的方向 首先 我不是统计学家 我是一名软件开发人员 其任务是尝试使用 R 重现 SPSS 因子分析的结果 使用 PC 提取和最大方差旋转 我在过去一周才接触过 R 所以我试图找到我的方式 我确实发现 2010 年的这篇
  • 将 SPSS 元数据变量标签、值标签、数据类型等导出到自定义文本文件

    我们有一个很大的 SPSS 文件 大小为 5MB 包含大约 1400 个变量 我们正在将所有内容迁移到数据库 为了配置表格和表单等 我们需要 SPSS 文件中的元数据 但采用特定的自定义格式 所以如果变量视图是这样的 Name Label
  • 在 SPSS 中生成语法的语法

    我正在尝试构建一个语法来在 SPSS 中生成语法 但我遇到了一些问题 我有一个包含元数据的 Excel 文件 我想使用它来创建一个语法来从中提取信息 就像这样 如果我有一个巨大的数据库 我只需要保持 Excel 更新 添加 删除变量 等等
  • 导入 .sav 时出现警告/错误

    我工作中有两个版本的 SPSS SPSS 11 在 Windows XP 上运行 SPSS 20 在 Linux 上运行 SPSS 的两个副本都工作正常 使用任一版本的 SPSS 创建的文件在其他版本的 SPSS 上打开时不会出现任何问题
  • 如何使用语法检查变量的度量(名义/序数/规模)?

    我想使用语法找到变量的度量 然后在 If 语句中使用它 使用语法可以吗 例如 如果我有两个变量a 标称 和b 序数 DO IF a is nominal END IF 您可以创建数据中所有名义变量的列表 在以下示例中 列表将存储在宏调用下
  • 用于将具有相同前缀的所有变量的值相加的 SPSS 语法

    我想知道是否有一种方法可以让 SPSS 将具有相同前缀的所有变量相加 例如 我有名为MFQAP 1 MFQAP 2 MFQAP 3等等 有没有办法告诉SPSS将所有以以下开头的变量相加MFQAP 我知道我可以告诉 SPSS 将所有变量相加M
  • UnicodeDecodeError:“charmap”编解码器无法解码位置 55 中的字节 0x81:字符映射到 <未定义>

    我是 Python 新手 希望有人能向我解释错误消息的含义 具体来说 我在Atom中保存了一些Python和SPSS结合在一起的代码 这是我以前的同事创建的 现在 由于前同事已经不在了 我现在需要运行代码 我所做的是从 SPSS22 运行下

随机推荐

  • UTF-8转换成GB2312的全处理

    主题 将UTF 8编码的字符串转化成GB2312的编码 没有对应编码的字符串转化为 DEC 的格式 如 gt 54924 语言 PHP Javascript 内容 浏览器用Javascript中encodeURI函数将字符串 包含非GB23
  • 蓝桥杯C++组怒刷50道真题(填空题)

    深夜伤感网抑云 南辰Music 御小兮 单曲 网易云音乐 多年后再见你 乔洋 周林枫 单曲 网易云音乐 填空题25题完结 等23年题目出来了会补充 下一步就是编程题了 24年蓝桥杯之前 一定会给大家精心准备几个博客 目录 填空题 一 蓝桥杯
  • OSPF和RIP

    OSPF协议 劢态路由协议 通过在路由器上运行劢态路由协议 在路由器乊间交互路由信息 学习路由信 息最织生成路由转収表项 常见的劢态路由协议 RIP OSPF ISIS EIGRP BGP 劢态路由协议适用场合 路由器数量较夗 网段数量较夗
  • 找出一个无序数组的中位数

    要解决这个问题首先要了解什仫是中位数 所谓的中位数就是在一组有序的数字中找到中间的那个数字 如果数字的个数是奇数则直接返回中间的那个数 如果数字的个数是偶数此时这组数据的中位数有两个 取中间两个数的平均值即可 想法一 不论用什仫排序算法使得
  • flutter android 和 ios 发布

    android篇 keytool genkey v alias android keyalg RSA validity 20000 keystore Users 当前用户的用户名 android keystore keytool genke
  • Web学习之JavaScript

    文章目录 一 什么是JavaScript 二 JavaScript 用法 三 Chrome 浏览器中执行 JavaScript 四 JavaScript 语法 五 JavaScript 语句 六 JavaScript 函数 七 JavaSc
  • 【redis】单机安装部署redis7.0版本

    下面我以redis 7 0 5版本 来进行讲解 链接 https pan baidu com s 1FesU8iHJQyW4pVARIqeQAA 提取码 qtqc 单机安装Redis 1 首先需要安装Redis所需要的依赖 yum inst
  • 预测知识

    预测知识 预测技术流程及模型评价 目录 预测知识 预测技术流程及模型评价 神经网络 机器学习 深度学习 参考资料 神经网络 神经网络 neural network 是机器学习的一个重要分支 也是深度学习的核心算法 神经网络的名字和结构 源自
  • 上传图片几种方式解析(上)--file

    浏览器上传图片到服务器时通过input type file 以及onchange事件的配合实现的 element和vant的ui库的图片上传都是基于这个 input的files属性 1 众所周知 一级dom事件不同于addeventlisn
  • c语言三目运算符的一些小细节,赋值不改变变量的值

    C语言三目运算符的一些小细节 赋值不改变变量的值 今天无聊翻翻C语言的课本 看到三目运算符的时候 心想这个和if else 语句用法一样 突然脑海里浮现一个想法 三目运算符结构 表达式1 表达式2 表达式3 表达式1 为逻辑表达式 如果为真
  • 使用左、右、全、内连接及使用where条件语句的区别

    使用左 右 全 内连接及使用 where 条件语句的区别 从学SQL语句到现在 从来没有使用过左右连接 也许会有人感到惊讶 但是确实是没有 因为我一直是使用的WHERE条件语句 我也想试一下效果 今天做了一下测试 终于知道 WHERE 条件
  • MySQL --- 多表查询

    多表查询 事务 以及提升查询效率最有手段的索引 一 多表查询 1 1 多表查询 概述 1 1 1 数据准备 将资料中准备好的多表查询数据准备的SQL脚本导入数据库中 部门表 员工表 1 1 2 介绍 多表查询 指从多张表中查询数据 就是从多
  • 系统架构设计师(第二版)学习笔记----信息安全基础知识

    原文链接 系统架构设计师 第二版 学习笔记 信息系统基础 文章目录 一 信息安全的概念 1 1 信息安全的基本要素 1 2 信息安全的内容 1 3 设备安全的内容 1 4 数据安全的内容 1 5 内容安全的含义 1 6 行为安全的含义 二
  • Python函数常见return返回值类型

    Python函数常见return返回值类型Python函数return返回值类型主要包括 class int class str class tuple class list class dict class bool class None
  • 小明和小强的故事 漫画版

    转载于 https blog 51cto com loofeer 676484
  • 发送arp请求报文

    1 报文格式 2 代码如下 include
  • Python爬虫入门教程(非常详细)

    初学Python之爬虫的简单入门 一 什么是爬虫 1 简单介绍爬虫 爬虫的全称为网络爬虫 简称爬虫 别名有网络机器人 网络蜘蛛等等 网络爬虫是一种自动获取网页内容的程序 为搜索引擎提供了重要的数据支撑 搜索引擎通过网络爬虫技术 将互联网中丰
  • C# 计算两个日期之间的所有日期

    用一个for循环就可以解决 int year Begin Convert ToInt32 this dateBegin Value ToString yyyy int month Begin Convert ToInt32 this dat
  • 解决英文版windows10安装软件中文显示乱码问题

    实验室买了台Thorlabs的设备 配了一台笔记本 带的操作系统是美版的windows10 为了提高笔记本的利用率嘛就在这台笔记本安装了一些中文软件 结果问题就出现了 安装完某些中文软件 能正常打开也能正常操作就是显示的中文乱码 在网上找了
  • [SPSS]系统聚类和kmeans聚类的spss实现——基于多维度对中国各城市聚类

    一 系统聚类 选中系统聚类并把变量移入变量框内 聚类选择按照个案聚类 在Display栏中选择Statistics和Plots复选框 这样在结果输出窗口中可以同时得到聚类结果统计量和统计图 选中绘图中的谱系图 单击保存选项卡 方案范围选择2