源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 928|回复: 0
打印 上一主题 下一主题

WEB网络应用在搜索引擎中的优化

[复制链接]

146

主题

1664

帖子

5

金币

初级会员

www.snsfw.com

Rank: 1

积分
1968
QQ
跳转到指定楼层
1#
发表于 2010-4-1 08:49:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我刚开始学习seo的时候,在论坛看到一个帖子,题目为影响搜索引擎排名最重要的30大因素。我觉得非常不错,并试图象背小学语文课本一样把它背下来,不 过怎么也背不下来。原因很简单,人家总结出来的东西来说没有一点逻辑顺序,而且我也根本不理解。
  
另外根据我的了解,大多数seoer对seo基本知识的学习都是混论坛,看高手的博客,我个人认为这里面存在三个你可能会犯的错误:一是容易人云亦云,二 是容易被一些错误的观点误导,三是只知其然,不知其所以然。

  
上面两段是很多人学习seo的不太好的方法,而问题的根本则是在于,这些人不了解搜索引擎的基本原理,不能站在搜索引擎的角度来思考seo。下面我从搜索 引擎的角度对影响排名的几个因素进行解释,看你是否会“知其然,更知其所以然”,并留下较深的印象。

  
一、传统IR的相关性排序:

  
在web搜索引擎出现之前,传统的IR(信息检索)系统被用来检索科技文献等纯文本文档,对检索的结果也涉及到相关性排序问题。解决方法基于共有词汇假设 (即一篇文档的内容可以用它所包含的词汇的集合来表示),采用经典的TF-IDF加 权算法。TF就是一个词在文档中出现的频率,它描述该词在一篇特定文档中的重要性;IDF是倒排文档频率,它描述的是该词在所有文档中出现的频率,即该词 的普遍重要性,如“我”,“什么”这些词几乎在所有的文档中都会出现,所以这些词即使在一篇特定的文档中出现的频率很高,也不是很重要。总的来说就是,一 个词在一篇特定文档的重要性,和TF成正比,和IDF成反比。

  
二、web搜索引擎的检索对象——网页,和传统IR的检索对象——文献等相比又有什么不同呢:

  
1、HTML标签。

和纯文本文档不同,网页的文本被HTML标签所包围,这也给搜索引擎了解一个网页上什么内容更重要提供了丰富信息。搜索引擎会给出现 在title标签中的词以最高的权重,H标签,strong等等标签中出现关键词也会有较高的权重。另 外网页编辑会利用HTML标签对网页进行排版,所以出现在网页开始部分的内容被搜索引擎认为是更重要的。

  
2、超链接。

网页和网页之间的链接是一种“参考”和“推荐”的关系。一个网页被很多网页所链接,那这个网页很可能是重要的。(链接的数量)并且搜索引擎会 参考相互链接的一个网页内容和链接的锚文本来判断另一个网页的内容。(链接的相关性)

  
三、在现在的web查询模式下,搜索引擎通过用户行为挖掘系统搜集用户行为,加入到搜索引擎排名算法中。

比如,在搜索引擎中你那个关键词的查询结果页面, 用户更多地点击了你的页面而并非排在你前面的,或者用户在你网站浏览的时间远大于你的同行网站,则说明你更受欢迎,搜索引擎会给予更高的权重。


听我说完以上这些,你是否能够理解,Direct Hit 公司的Gary Cullis 在搜索引擎1999 年年会上将搜索引擎使用的四种技术,即:1.根据网页本身信息(Author);2. 根据超链链接关系(Other Author);3.人工编辑产生的目录系统(Editor);4. 根据用户行为(User)这其中的三种呢?
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2024-11-16 06:28 , Processed in 0.118344 second(s), 26 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明