基于Ajax+Lucene构建搜索引擎的设计与实现（含源代码）

上传者：蓝天 | 格式：zip | 页数：23 | 大小：5117KB

文档介绍

页面组成,其中每个页面其实是一个更小型的Ajax应用。每个页面上面都包括有一些使用JavaScript开发的Ajax组件。这些组件使用XMLHttpRequest对象以异步的方式与服务器通信,从服务器获取需要的数据后使用DOM API来更新页面中的一部分内容。因此Ajax应用与传统的Web应用的区别主要在三个地方:Р1. 不刷新整个页面,在页面内与服务器通信。Р2. 使用异步方式与服务器通信,不需要打断用户的操作,具有更加迅速的响应能力。Р3. 系统仅由少量页面组成。大部分交互在页面之内完成,不需要切换整个页面。Р由此可见,Ajax使得Web应用更加动态,带来了更高的智能,并且提供了表现能力丰富的Ajax UI组件。Р3 需求分析Р3.1 同步环境Р本系统的同步环境如图3:Р图3 同步环境Р检索Web页面。Р3.2功能需求Р本设计要实现的功能:Р上的网页内容、标题、链接等信息按链式收集。Р能够实现一定链接深度的网页收集,上实现一定的URL级的数据收录。Р对收集到的数据存入MSSQL Server 2000等关系型数据库中、或者存入文本文件中。Р网站信息库中的信息会不断的变动,对收集到的数据需要定期的自动维护,做到定期的删除、从新收集。Р对收集到的数据进行关键词的检索。Р对检索出的数据要可定位性,即可以显示对数据的出处的链接。Р实现中英文分词功能,能够按中文或者英文单词检索数据。Р实现无刷新的显示搜索结果,对搜索用时的计算、显示,关键字高亮显示等。Р逻辑搜索功能比如“中国”AND“北京”AND NOT(“海淀区”AND“中关村”)。Р3.3 性能需求Р精度:Р1.1对收集到的信息需要一定的完整性,即对链接层次里的每个链接页面都能够收集得到,并写入收集的存储区里。Р1.2对搜索出的内容需要包含有关键字信息Р时间特性要求:Р?2.1数据收集时,网上Web信息的收集,并且采用URL