聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果,这也成为K-means算法的一个主要问题。5)K-means算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。6.2模型改进1)在进行K-means算法计算时,可以采用遗传算法(GA),例如文献中采用遗传算法(GA)进行初始化,以内部聚类准则作为评价指标。2)在进行聚类分析时需要对所采用算法的时间复杂度进行分析、改进,提高算法应用范围。在文献中从该算法的时间复杂度进行分析考虑,通过一定的相似性准则来去掉聚类中心的侯选集。而在文献中,使用的K-means算法是对样本数据进行聚类,无论是初始点的选择还是一次迭代完成时对数据的调整,都是建立在随机选取的样本数据的基础之上,这样可以提高算法的收敛速度。7参考文献[1]姜启源,谢金星,数学模型(第三版)[M],北京:高等教育出版社,2003。[2]卓金武,MATLAB在数学建模中的应用[M],北京:北京航空航天大学出版社,2011。[3]韩中庚,数学建模方法及其应用[M],北京:高等教育出版社,2005。[4]谢中华,MATLAB统计分析与应用:40个案例分析[M],北京:北京航空航天大学出版社,2011。[5]丁刚,甘肃省各市州人口环境的发展水平的综合评价与聚类分析[J],河西学院学报,2008第24卷第6期。[6]叶水仙,刘慧青,林国剧,基于聚类分析方法的人口区划研究[J],科协论坛,2013年第5期(下)。[7]周忠学,聚类分析在人口状况研究中的应用[J],社科纵横,2005年2月总第20卷第1期。[8]宋丽红,K-均值聚类的Matlab仿真设计[J],实验技术与管理,2010年10月第27卷第10期。