源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 1010|回复: 0
打印 上一主题 下一主题

[转载] 搜索引擎算法之TrustRank值

[复制链接]

141

主题

370

帖子

623

金币

初级会员

Rank: 1

积分
1569
跳转到指定楼层
1#
发表于 2012-5-7 13:32:27 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
TrustRank 算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。TrustRank 算法发明人还发表了一份专门的PDF文件,说明 TrustRank 算法的应用。

  TrustRank 算法并不是由Google提出,不过由于Google所占市场份额最大,而且 TrustRank在Google排名中也是一个非常重要的因素,所以有些人误以为TrustRank是Google提出的。更让人糊涂的是,Google曾经把TrustRank申请为商标,但是TrustRank商标中的TrustRank指的是Google检测含有恶意代码网站的方法,而不是指排名算法中的信任指数。

  TrustRank算法基于一个基本假设:好的网站很少会链接到坏的网站。反之则不成立,也就是说,坏的网站很少链接到好网站这句话并不成立。正相反,很多垃圾网站会链接到高权威、高信任指数的网站,意图提高自己的信任指数。

  基于这个假设,如果能挑选出可以百分之百信任的网站,这些网站的TrustRank评为最高,这些TrustRa,nk最高的网站所链接到的网站信任指数稍微降低,但也会很高。与此类似,第二层被信任的网站链接出去的第三层网站,信任度继续下降。由于种种原因,好的网站也不可避免地会链接到一些垃圾网站,不过离第一层网站点击距离越近,所传递的信任指数越高,离第一级网站点击距离越远,信任指数将依次下降。这样,通过TrustRank算法,就能给所有网站计算出相应的信任指数,离第一层网站越远,成为垃圾网站的可能性就越大。

  计算TrustRank值首先要选择一批种子网站,然后人工查看网站,设定一个初始TrustRank值。挑选种子网站有两种方式,一是选择导出链接最多的网站,因为TrustRank算法就是计算指数随着导出链接的衰减。导出链接多的网站,在某种意义上可以理解为“逆向PR值”比较高。

  另一种挑选种子网站的方法是选PR。值高的网站,因为PR值越高,在搜索结果页面出现的概率就越大。这些网站才正是TrustRank算法最关注的、需要调整排名的网站。那些PR值很低的页面,在没有TrustRank算法时排名也很靠后,计算TrustRank意义就不大了。

  根据测算,挑选出两百个左右网站作为种子,就可以比较精确地计算出所有网站的TrustRank值。

  计算TrustRank随链接关系减少的公式有两种方式。一是随链接次数衰减,也就是说第一层页面TrustRank指数是一百的话,第二层页面衰减为 90,第三层衰减为80。第二种计算方法是按导出链接数目分配TrustRank值,也就是说一个页面的TrustRank值是一百,页面上有5个导出链接的话,每个链接将传递20%的TrustRank值。衰减和分配两种计算方法通常综合使用,整体效果都是随着链接层次的增加,TrustRank值逐步降低。

  得出网站和页面的TrustRank值后,可以通过两种方式影响排名。一是把传统排名算法挑选出的多个页面,根据TrustRank值比较,重新做排名调整。二是设定一个最低TrustRank值门槛,只有超过这个门槛TrustRank值的页面,才被认为有足够的质量进入排名,低于门槛的页面将被认为是垃圾页面,从搜索结果中过滤出去。

  虽然TrustRank算法最初是作为检测垃圾的方法,但在现在的搜索引擎排名算法中,TrustRank概念使用更为广泛,常常影响大部分网站的整体排名。TrustRank算法最初是针对页面级别,现在在搜索引擎算法中,TrustRank值也通常表现在域名级别,整个域名的信任指数越高,整体排名能力就越强。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2024-11-17 23:36 , Processed in 0.108919 second(s), 26 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明