源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 1130|回复: 0
打印 上一主题 下一主题

作为一个SEOer来说熟悉与深入了解搜索引擎的工作原理

[复制链接]

60

主题

60

帖子

0

金币

初级会员

Rank: 1

积分
42
QQ
跳转到指定楼层
1#
发表于 2013-6-24 16:21:13 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
作为一个SEOer来说熟悉与深入了解搜索引擎的工作原理
作为一个SEOer来说,熟悉与深入了解搜索引擎的工作原理,是工作内容的重要步骤,同时,SEO是一个看似简单但实质却有些复杂的工作,如何才能让SEO更加简单,同时带来更大的利益,让企业发展的更好,都是一个不容忽视的问题。
    在讨论之前我想问大家一个问题,你是否有想过搜索引擎是如何做到一短短的零点几秒内可以完成上百万甚至上亿的页面检索与排序?要是没有一个合理的算法与机制,我想目前世界上任何一台大型计算机都不太可能在那么短的时间内搞定检索、排序。我们带着问题开始今天的搜索引擎之路。
    搜索引擎之后的一句话就是蛛蛛,我们做SEO的站长们往往会把蛛蛛与搜索引擎直接联系起来。确实他们是一个有机的整体,从搜索引擎角度来说,它最缺的东西永远是内容。那么蛛蛛在这个里面就起到了,去抓取网络里的内容。只是蛛蛛的爬行方式是通过我们网站的链接来进行抓取。那么这个我们就可以把这个过程认为是搜索引擎工作原理里面的“采集”
    针对蛛蛛采集网站内容,我们站在搜索引擎的角度来看。搜索引擎他们也是人来创造的,他们也必定会考虑硬件成本。那么蛛蛛每次对某个网站的抓取时间与抓取深度肯定不一样。更何况有些网站的链接还不能保持通畅,有些网站链接而且弄的很深很长。那么这些表现形式其实都是我们优化过程经常会操作到的。URL标准化、网站结构等一系列的问题。
    蛛蛛采集回内容,放到了搜索引擎数据库里。那么是不是就直接把这些数据编进索引?其实不是的,他必定要做下处理与分类。在这个工作过程中,必定会去判断本次的内容的质量度(只是做初步判断)当然包括这个页面是否有更新?这个就是我们大家常说的网站快照。
    当然这个里面的过程比我上面说的复杂的多,比如提取网页的信息,网页本身的链接等。其实我们也不难发现,其实搜索引擎在抓取来内容的时候必定已经做了一些处理,为了更好的服务后面的查询服务。
    查询服务 这个就是搜索引擎的最重要的一步,www.bookwoo.com通过一些大量的采集与处理最终实现网页的排序。这里为什么会说网页的排序是重最要的呢?从搜索引擎与用户的角度来说,用户之所以会用搜索引擎是因为他们想利用搜索引擎来找寻他们想要的内容。www.szyz.net那么从搜索引擎角度来说,假如这个搜索引擎在返回的结果里没能达到用户的最终期望值,那么我相信这个搜索引擎肯定活不长。
    关于搜索引擎的工作原理,在这里何涛只是简单的说了一些。主要的就是希望大家能够了解搜索引擎的大概,我们更要体会到网站优化与搜索引擎之间的距离,其实真的很近。只是当有些朋友连自己的服务对象都搞不清来操作网站优化更多的只会浪费时间,最终无法实现真正的优化。
本文由yyxoxo130624改编发布
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2024-11-24 10:52 , Processed in 0.134319 second(s), 27 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明