全文预览

搜索引擎技术、现状、以及未来发展趋势的文献综述

上传者:似水流年 |  格式:doc  |  页数:17 |  大小:0KB

文档介绍
。最典型的是人名,人可以很容易理解句子“王军虎去广州了”中,“王军虎”是个词,因为是一个人的名字,但要是让计算机去识别就困难了。如果把“王军虎”做为一个词收录到字典中去,全世界有那么多名字,而且每时每刻都有新增的人名,收录这些人名本身就是一项巨大的工程。即使这项工作可以完成,还是会存在问题,例如:在句子“王军虎头虎脑的”中,“王军虎”还能不能算词?Р  新词中除了人名以外,还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题,而且这些又正好是人们经常使用的词,因此对于搜索引擎来说,分词系统中的新词识别十分重要。目前新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。РР5、几种典型的汉语自动分词系统Р5.1、几个早期的自动分词系统Р?5.1.1、我国第一个实用的自动分词系统CDWS Р?5.1.2、山西大学计算机系研制的自动分词系统ABWSР?5.1.3、北京航空航天大学于1988年实现的分词系统CASSР?5.1.4、北京师范大学现代教育研究所于1991前后研制实现的书面汉语自动分词专家系统РР5.2、清华大学SEG分词系统Р5.3、清华大学SEGTAG系统Р5.4、国家语委文字所应用句法分析技术的汉语自动分词Р5.5、复旦分词系统Р5.6、哈工大统计分词系统Р5.7、杭州大学改进的MM分词系统Р5.8、Microsoft Research 汉语句法分析器中的自动分词Р5.9、北大计算语言所分词系统Р北大计算语言汉语文本分析系统РРР四、当前搜索引擎的发展状况、Р1、搜索引擎的作用Р目前,每个行业、领域都在飞速发展,这中间产生了大量的信息资源,为了能够从互联网上及时准确的获取最新的信息,搜索引擎是必然的产物。Р据当前不完全统计,61.9%的网民认为搜索引擎必不可少,36.8%的网民认为搜索引擎和其他途径共同组成自己获取信息的来源。РР图:搜索引擎的作用

收藏

分享

举报
下载此文档