全文预览

个人建站指南

上传者:火锅鸡 |  格式:docx  |  页数:25 |  大小:51KB

文档介绍
何东西,搜索引擎几乎立刻就从他知道的几百万的页面中挑选出与你的主题相匹配的那些,呈现在你的荧屏上。这些网页按一定的顺序排列起来,最相关的排在最前面。Р但搜索引擎并不是图书管理员,他没有能力一再地询问有关的问题来更好地定位搜索的目标,也不能依靠智力判断和过去的经验来排列网页,而人可以做到。智能化是发展的方向,但还有一段很长的路要走。Р那么搜索引擎是怎样决定相关性的呢?他们依靠一套规则,主要的规则是页面中关键词出现的位置和频率,我们把这称做"位置/频率法"。Р1、位置和频率Р(1)、位置Р如果你到图书馆去寻找有关旅游方面的书,管理员首先会去查找题目中有"旅游"的书籍。搜索引擎也一样,关键词(即〃旅游〃)出现在题目(Titie)中的页面比那些Title中不出现关键词的页面更相关。Р搜索引擎还会检查关键词是否出现在页面的顶部,如文章标题中或前面的几个段落。他们认为与搜索主题相关的页面在开始都会提到那些词语。Р(2)、频率频率是相关性的另外一个主要因素。搜索引擎会分析页面中关键词相对其他词语所出现的频率,频率越高,就越具相关性。Р2、搜索引擎在排列网页时有一定的差异Р所有的搜索引擎都有以上提到的三个基本部分,在一定程度上都符合"位置/频率法",但在具体实施上又有区别,这就是为什么我们用不同的搜索引擎做同样的搜索时会产生不同结果的原因。Р首先,有些搜索引擎会比其他搜索引擎索引到更多的Web页面,有些又会比其他引擎更新索引的频率快,所以搜索引擎索引中不可能收集完全一样的Web页面。Р其次,出于某种原因,有些搜索引擎也可能给某些Web页面在排列层次上有优先权。如Excite用链接的流行度作为排列网页的一个因素,他知道在索引中哪些页面有许多指向他们的链接,他在排列时就给这些页面小小的奖励,将他们适当提前。这也是合理的,因为在Internet上有越多指向他们的链接,就说明这些页面更被大家看重。

收藏

分享

举报
下载此文档