源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

标题: SEO谣言终结者之GZIP压缩对蜘蛛抓取的影响 [打印本页]

作者: 封心    时间: 2010-10-5 07:04
标题: SEO谣言终结者之GZIP压缩对蜘蛛抓取的影响
SEO谣言终结者之GZIP压缩对蜘蛛抓取的影响
之前写过一篇终结SEO谣言的文章,彻底驳斥了同一ip会被K的论调,这一次,让我们来彻底终结Gzip压缩技术会影响蜘蛛抓取这一观点,还Gzip一个清白。
  首先,Gzip到底是个什么东西?GZIP最早由Jean-loup Gailly和Mark Adler创建,用于UNIX系统的文件压缩。我们在Linux中经常会用到后缀为.gz的文件,它们就是GZIP格式的。现今已经成为Internet 上使用非常普遍的一种数据压缩格式,或者说一种文件格式。HTTP协议上的GZIP编码是一种用来改进WEB应用程序性能的技术。大流量的WEB站点常常使用GZIP压缩技术来让用户感受更快的速度。说得更简单明了一点,Gzip就是用来压缩你的页面,它的终极目的就是加快网站的访问速度,从而提升用户体验。
  综上所述,我们得出了结论,Gzip就是加快网站访问速度,提高用户体验的一种方法,值得注意的一点是,它是一个服务器端的行为,也就是说,它是通过服务器的功能来对网页进行压缩的,而它所需要的客户端支持仅仅是浏览器需要支持Gzip,仅此而已!我们知道,市面上几乎所有主流浏览器全都支持Gzip压缩技术,而作为前端页面调试专家firefox的Yslow插件也把Gzip压缩是否开启作为一个页面是否合格的评分标准。由此看来,Gzip不是一个旁门左道的技术,而是作为一个符合W3C的标准而存在,试问这样的标准,有那个搜索引擎会去抵制呢?
  我们知道,蜘蛛抓取页面的过程,实际上是一个客户端行为,而Gzip压缩是一个服务器端的行为;蜘蛛抓取其实和普通人用浏览器浏览网站没什么区别,唯一的区别就是它读的不是经过浏览器解析过的页面,它是直接读的页面源代码。这样,问题就迎刃而解了,通过试验我们发现,经过Gzip压缩的网页和未经过Gzip压缩的网页,二者的源代码没有任何的区别。既然没有区别,那又怎么可能去影响蜘蛛抓取网页呢?
  “请谨慎开启Gzip”,这句话其实并没有错,因为它说的本来就跟蜘蛛抓取没有一毛钱的关系,这句话的原意是指,开启Gzip会消耗一些服务器的资源,换句话说,如果要使用这种压缩技术,服务器的配置一定要中上等的,小型的服务器比如虚拟主机,如果开启了Gzip会造成服务器过载,而造成系统缓慢。有的人不知道为什么就把这句话跟搜索引擎抓取联系了起来,从而误导了广大新手站长。这里分享一个不用配置服务器就可以开启Gzip 压缩的方法:
  比如你的网站首页地址是www.coudian.com/    +index.php,那么,你就用记事本打开index.php文件,在页面头部加上一句Ob_Start('ob_gzhandler');就搞定了。这样index.php就经过了Gzip压缩,如果你还想压缩别的php文件,那么一次打开加上代码就行了。
  造谣可耻,传谣可恨,信谣可悲,辟谣可敬!希望广大站长能够擦亮眼睛,不要轻信谣言,也希望关于SEO的谣言能够越来越少,最后希望这是最后一篇SEO谣言终结者系列文章。
作者: zhbo1689    时间: 2010-10-7 10:24
先沙发在看
作者: hungchia    时间: 2011-7-22 01:14
桐乡外卖网 http://www.txwaimai.com
嘉兴外卖网 http://www.jxwaimai.com   
嘉兴交友网 http://www.jxyuan.com
绵阳房产网 http://www.myfcw.cn  
禾城主机   http://www.cn0573.net
嘉兴QQ群   http://qqun.cn0573.net  
桐乡做网站 http://im.cn0573.net




欢迎光临 源码论坛,商业源码下载,尽在锦尚中国商业源码论坛 (https://bbs.52jscn.com/) Powered by Discuz! X3.3