全文预览

基于大数据的社交网络数据挖掘-毕业论文

上传者:hnxzy51 |  格式:docx  |  页数:64 |  大小:1354KB

文档介绍
件产品,是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构的数据库之一。РORACLE数据库是目前世界上使用最为广泛的数据库管理系统,作为一个通用的数据库系统,它具有完整的数据管理功能;作为一个关系数据库,它是一个完备关系的产品;作为分布式数据库它实现了分布式处理功能。但它的所有知识,只要在一种机型上学习了ORACLE知识,便能在各种类型的机器上使用它。Р2.2数据挖掘工具(介绍Clementine 12.0)Р数据挖掘工具主要有两大类:一类是应用于特定领域的专用数据挖掘工具; 另一类是应用面较广的通用数据挖掘工具。Р专用数据挖掘工具针对某个特定领域的问题提供解决方案。在算法设计方面, 充分考虑到数据、需求的特殊性,并进行优化。例如:IBM公司的Advanced Scout 系列,针对NBA数据,帮助教练优化战术组合。Р通用数据挖掘工具处理常见的数据类型,采用通用的数据挖掘算法,提供较为通用的处理模式,如分类模式、回归模式、时间序列模式、聚类模式、关联模式等。例如:IBM公司的QUEST和Intelligent Miner系统、SGI公司的Mine Set 系统、新西兰Waikato大学开发的数据挖掘平台Weka、美国Business Objects公司的Business Miner系统、SAS公司的SAS EM(Enterprise Miner)、SPSS公司的SPSS Clementine系统等。Р本文选用SPSS公司的Clementine产品,该产品属于通用商业化挖掘工具,产品成熟稳定、功能完善,市场占有率连续多年位居榜首,远远领先于其他产品, 而且该产品采用可视化方法建立挖掘流程,人性化界面设计,可以方便地通过参数设定,实现各种挖掘算法。该产品还能和SPSS统计工具集成,易实现数据的初步探索和直观分析。 Clementine的主要技术特点如下:

收藏

分享

举报
下载此文档