研究领域得到了广泛的应用。如一个站点的入链数目远大于出链数目,那么这个站点可能是服务器;如果一个页面经常被引用,那么可以反映该页面的流行程度和重要性等。Р2.3 Web日志挖掘(Web usage Mining)? Web日志挖掘的对象是Web使用记录数据,除了服务器的日志记录外还包括代理服务器日志、浏览器端日志、注册信息、用户会话信息、交易信息、Cookie中的信息、用户查询、鼠标点击?流等一切用户与站点之间可能的交互记录,因此Web使用记录的数据量是非常巨大的,而且数据类型也相当丰富。通过挖掘相关的Web日志记录,从中发现用户访问Web页面的模式;通过分析日志记录中的规律,来识别用户的忠实度、喜好、满意度,从中发现潜在用户,增强站点的服务竞争力。? Web日志挖掘对源数据的处理方法可以分为两Р类,一种是将Web使用记录数据转换并传递进传统的关系表里,再使用数据挖掘算法进行常规挖掘;另一种是将Web使用记录数据直接预处理再进行挖掘。? Web日志挖掘技术通常可以应用到两个领域:当用来分析Web服务器的访问日志时,可以利用挖掘得到的服务模型来设计适应性Web站点;当应用到单个用户时,通过分析用户的访问历史来发现有用的用户访问模式。Web日志挖掘由于处理数据对象通常为用户的访问历史或服务器的访问日志,无法得知数据对象代表的内容,得到的结果一般比较粗糙,但是由于该方法比较成熟而且实现起来也较内容挖掘简单,在个性化系统中也得到了较广泛的应用。Р3.WEB数据挖掘的流程Р 数据采集? 数据预处理? 模式挖掘? 模式评估Р3.1数据采集? Web挖掘的数据源来自于Web页面上的信息、Web访问形式的数据库、Web页面内部的结构以及页面之间的结构信息以及Web服务器上的使用记录数据,如服务器日志、用户会话信息、交易信息等。Web数据挖掘,针对不同的采集对象,需要应用不同的数据采集技术。