中心点的反复迭代来改进划分。典型算法包括k-means算法和k-medoids算法等。Р层次方法:Р对给定数据集合进行逐层递归的合并或者分裂,因此可以被分为合并或分裂方法。合并方法首先将每个对象都作为独立的类,然后持续合并相近的类,直到达到终止条件为止。分裂方法首先将所有的数据对象置于一个类中,然后反复迭代并判定当前的类是否可以被继续分裂,直到达到终止条件为止。Р基于密度的方法:Р只要某区域数据密度超过阈值,就将该区域的数据进行聚类。其优势在于噪音数据下的抗干扰能力,并能够发现任意形状的聚类。Р基于网格的方法:Р把对象空间量化为具有规则形状的单元格,从而形成一个网格状结构。在聚类的时候,Р将每个单元格当作一条数据进行处理。优点是处理速度很快,因处理时间与数据对象数目无关,而只与量化空间中的单元格数目相关。Р基于模型的方法:Р如果事先已知数据是根据潜在的概率分布生成的,基于模型的方法便可为每个聚类构建相关的数据模型,然后寻找数据对给定模型的最佳匹配。主要分两类:统计学方法和神经网络方法。Р离群点:数据集合中存在的一些数据对象,它们与其余绝大多数数据的特性或模型不一致。Р5.演化分析:演化分析的目的是挖掘随时间变化的数据对象的变化规律和趋势,并对其建模,进而为相关决策提供参考。演化分析的应用Р结论:大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。Р大数据的特点有四个层面:第一,数据体量巨大。第二,数据类型繁多。第三,处理速度快,可从各种类型的数据中快速获得高价值的信息。第四,只要合理利用数据并对其进行正确、准确的分析,将会带来很高的价值回报。Р参考文献:Р刘云浩.物联网导论.北京:科学出版社,2011:005-006 .Р王珊,萨师煊.数据库系统概论:高等教育出版社,2009:46-47.Р百度百科:网络存储体系,搜索引擎。