全文预览

数据挖掘在税务工作中的应用

上传者:你的雨天 |  格式:doc  |  页数:57 |  大小:0KB

文档介绍
业每天都积累了大量事务型数据,这些数据处于动态的变化之中,不利于进行决策支持分析,而数据仓库技术正是将决策支持型数据处理从事务型数据处理中分离出来,是最有效的数据组织方式;同时利用传统的统计方法来进行数据分析难以处理大数据集,数据挖掘技术正是为了解决传统分析方法的不足,针对大规模数据的分析处理而出现的。Р本章介绍了数据仓库和数据挖掘的概念特征、方法工具以及应用现状和发展趋势。Р2.1数据仓库理论综述Р2.1.1 数据仓库Р数据仓库(Data Warehouse)是20世纪90年代初提出的概念,到20世纪90年代中期已经形成潮流。在美国,之后的又一技术热点。Р数据仓库的产生是针对各种需求的,例如:公司的业务系统很多,众多系统的历史数据不方便查询;同时不同的业务系统往往管理部门不同、地域不同,不方便管理,也不方便将数据统一起来进行分析。因此要搜集来自各个系统的有用数据,存放在整合的储存区内。数据仓库其实就是将数据库中的原始数据经过处理整合而形成的容量特别大的关系型数据库,供决策支持或数据分析使用。而这可以从数据仓库定义中的四个特性来理解:数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策 W.H.Inmon在其著作《Building the Data Warehouse》一书中给予数据仓库的定义。Р。从信息技术的角度来看,数据仓库的目标是在组织中,在正确的时间,将正确的数据交给正确的人 Alex Berson,贺奇译.构建面向CRM的数据挖掘应用[M].北京:人民邮电出版社,2001.Р。数据仓库是市场激烈竞争的产物,它的目标是达到有效的决策支持。大型企业几乎都建立或计划建立自己的数据仓库,数据库厂商也纷纷推出自己的数据仓库软件。

收藏

分享

举报
下载此文档