全文预览

交通数据处理与分析 第三章 聚类分析

上传者:火锅鸡 |  格式:ppt  |  页数:92 |  大小:4067KB

文档介绍
物以类聚、人以群分;但根据什么分类呢?如要想把中国的县分类,就有多种方法可以按照自然条件来分,比如考虑降水、土地、日照、湿度等,也可考虑收入、教育水准、医疗条件、基础设施等指标;既可以用某一项来分类,也可以同时考虑多项指标来分类。聚类分析是研究分类问题的一种多元统计方法。所谓类,就是指相似元素的集合聚类分析的研究目的把相似的东西归成类,根据相似的程度将研究目标进行分类。对一个数据,既可以对变量(指标)进行分类(相当于对数据中的列分类),也可以对观测值(事件,样品)来分类(相当于对数据中的行分类)。当然,不一定事先假定有多少类,完全可以按照数据本身的规律来分类。本章要介绍的分类的方法称为聚类分析(clusteranalysis)。聚类分析中“类”的特征:聚类所说的类不是事先给定的,而是根据数据的相似性和距离来划分我们看看以下的例子:有16张牌如何将他们分为一组一组的牌呢?AKQJ分成四组每组里花色相同组与组之间花色相异AKQJ花色相同的牌为一副Individualsuits分成四组符号相同的牌为一组AKQJ符号相同的的牌Likefacecards这个例子告诉我们,分组的意义在于我们怎么定义并度量“相似性”AKQJ聚类分析的研究对象R型分析----对变量进行分类Q型分析----对样品进行分类聚类分析研究的主要内容如何度量事物之间的相似性?怎样构造聚类的具体方法以达到分类的目的?

收藏

分享

举报
下载此文档