8Р4.3聚类分析总结?40Р?Р第1章数据仓库和数据挖掘简介Р1.1数据简介Р我的数据集是由两个不同的数据库组成,因为做关联规则的时候,影响小学生自控能力的因素分析调查分析数据库,不具备关联规则一对多的条件,因此,我用了课本上的的超市交易数据集。所以做关联规则的超市数据集,在这里我就不多介绍了。Р做决策树,聚类分析所用的数据集影响小学生自控能力的因素分析调查分析数据库主要父母文化程度,家庭经济状况,教师要求,民族,年纪,年龄,师生关系,是否单亲,是否是独生子女,兴趣,性别,姓名,学号,性格,自控能力属性组成。此表是用来调查影响小学生自控能力的因素有哪些。此数据集做决策树的目的是,可以根据小学生的基本情况大致了解他的自控能力。此数据集做聚类分析,可以从中挖掘出小学生基本情况的分类。Р1.2数据挖掘技术Р关联规则、决策树、聚类分析。Р第2章创建数据仓库Р2.1 数据Р2.1.1 数据属性结构Р如表2-1、2-2所示。Р表2-1 超市数据交易表Р表2-2 影响小学生自控能力的因素分析调查表Р2.1.2 数据库的相关处理Р1.创建数据库Р2.数据集导入Р3.设置主键Р4.创建数据库关系图Р2.1.3 实验的开发平台Р1.实验设备:PCР2.主要开发软件:SQL Sever 2005Р3.辅助软件:Office Р2.2 数据库的结构模块简介Р本数据库有两个数据集组成,超市交易数据集和影响小学生自控能力的因素分析调查表两个数据集。超市交易中有ID和Items两个属性;影响小学生自控能力的因素分析调查表数据集中有年级、学号、姓名、年龄、性别、民族、是否单亲、是否独生子女、父母文化程度、家庭经济状况、是否为班委、教师要求、师生关系、兴趣、性格、自控能力等属性。Р第3章数据挖掘过程Р3.1 关联规则Р3.1.1关联规则挖掘过程图解Р 1.商业智能项目创建过程图解Р2.数据源的创建过程图解