离来划分?聚的数目和结构都没有事先假定Р注意:聚类也可以是不明确的Р有多少聚类?Р四个类Р2个类Р六个类Р聚类分析正在蓬勃发展,广泛应用于一些探索性领域,如统计学与模式分析,金融分析,市场营销,决策支持,信息检索,WEB挖掘,网络安全,图象处理,地质勘探、城市规划,土地使用、空间数据分析,生物学,天文学,心理学,考古学等。Р4.1.1 聚类分析研究的主要内容Р(1) 模式表示(包括特征提取和/或选择);?(2) 适合于数据领域的模式相似性定义;?(3) 聚类或划分算法;?(4) 数据摘要;?(5) 输出结果的评估。Р4.1.2 数据挖掘对聚类算法的要求?聚类是一个富有挑战性的研究领域,数据挖掘对聚类的典型要求如下:?(1)可伸缩性(Scalability) ?(2)处理不同类型属性的能力?(3)发现任意形状的聚类?(4)用于决定输入参数的领域知识最小化?(5)对于输入记录顺序不敏感?(6)高维性?(7)处理噪音和异常数据的能力?(8)基于约束的聚类?(9)可解释性Р4.1.3 典型聚类方法简介Р划分方法(partitioning methods)基于质心(K-means)、中心的划分方法?层次的方法(hierarchical methods)BIRCH 、ROCK 、CURE?基于密度的方法 DBSCAN、 OPTICS?基于图的方法 Chameleon、SNN?基于网格的方法(grid-based methods) STING 、WaveCluster 、CLIQUE?基于模型的方法(model-based methods)EM、 COBWEB、神经网络?其他聚类方法谱聚类算法(spectral clustering)、蚁群聚类算法等Р基于划分的聚类Р原始数据点Р基于划分的聚类结果Р基于层次的聚类Р传统的层次聚类Р非传统的基于层次的聚类Р非传统的树图Р传统的基于层次的树图