源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

标题: 百度判断网页质量的方法 [打印本页]

作者: quiet    时间: 2013-12-24 13:07
标题: 百度判断网页质量的方法

  一、通过对搜索结果的二次点击率(或多次)进行判断

  二次点击率是指:当用户点击某结果后,(因不满意结果)产生第二次点击(或多次)的比率

  如果某页面二次点击率非常低,百度搜索引擎有理由相信,此网页的关键词匹配度非常高,同时文章的质量也有保证。因为,众多用户的行为已经为网页投了关键的一票。

  二次点击率是相对上一条点击而言。百度搜索默认显示10条搜索结果,我们假设一个这样的情景:大量用户点击到第6条结果,就不再点击其他结果,从常理来说,第6条结果的网页,是最匹配的,那么质量度自然较高。如果这种数据表现达到一定程度,百度很可能会把它的排序提高到前面几位(提高排序权重)。

  二、通过两次点击之前花费的间隔时间进行判断

  根据普通用户习惯,他会先打开并查看A网页,可能结果不满意或信息量不足够,他又回到百度搜索界面,点击了B网页,阅读完B网页后,他又打开C网页。

  我们可以看到,A->B 时间间隔, B->C 时间间隔 是百度可以获取的信息。 通过海量用户的间隔时间的横向比较分析,百度足够建立这样一个关键指标。

  假设大量数据显示,A->B 时间间隔为30秒,B->C 时间间隔为 50秒,那么搜索引擎认为,B的质量高于A。 这就是间隔时间判断的一个重要逻辑。大连武校www.slydwx.com





欢迎光临 源码论坛,商业源码下载,尽在锦尚中国商业源码论坛 (https://bbs.52jscn.com/) Powered by Discuz! X3.3