源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 866|回复: 1
打印 上一主题 下一主题

[交流] seo关键词分析很重要

[复制链接]

594

主题

593

帖子

794

金币

初级会员

Rank: 1

积分
2004
QQ
跳转到指定楼层
1#
发表于 2014-7-28 11:35:33 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1、搜索引擎要先分析对网页进行净化处理
  这主要的是去掉网页中大量无用的广告、导航栏等网页模板噪声以及无意义的内容,如JavaScript脚本,CSS标记等内容。至于搜索引擎采用的是何种算法,则不为我们所知,但是个人估计应该是对网页进行划分为不同的快,通过衡量网页块的重要程度来判断出包含主题内容的块,然后提取出该块的内容,至于搜索引擎如何判别网页快的重要程度,那是另外一个课题。
  2、针对提取出的内容进行分词处理
  个人认为,搜索引擎可能采用了某种算法,对内容先进行了词语粗分阶段,先得出N个概率最大的切分结果;然后,利用角色标注方法识别未登录词,并计算其概率,将未登录词加入到切分词图中,之后视其为普通词处理,最终进行动态规划优选出N个最大概率切分标注结果。并进行记录。
  3、对初步分词的结果进行去除无意义的词语
  搜索引擎通过对第二步的分词结果进行分析,去除一些语气词和形容词等非实意词和一些单词,同时还考虑到单字词所表达的信息不够完整也应当滤除。去除停用词通过建立一个停用词列表来实现。
  4、对关键词的权重进行确定分析
  在完成对文章分词切分和净化工作之后,就要将文章所有关键词进行分析了,的想法是搜索引擎将文本表示成Ⅳ维特征向量,每一维分量由关键词及其权重组成。一般认为,关键词在文中的权重的确定,主要由三部分组成,词频,位置和词义共同影响决定。而词频和位置对词语或短语的影响可以通过确定的算法加以确定,词义权重也有固定的算法进行分析计算。搜索引擎利用设定好的算法对上述关键词进行了计算和分析。从而得到最后的结果。
凤凰平台http://www.phfh123.com



分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享

123

主题

1122

帖子

253

金币

初级会员

Rank: 1

积分
1315
QQ
2#
发表于 2014-10-25 21:39:55 | 只看该作者
为了不扰乱会员对源码的测试,有问题咨询右侧客服不要直接回复,否则视为非法信息屏蔽会员ID!
惠米折www.huimizhe.com国内优质的折扣商品推荐平台-米折网9.9元包邮专区,汇集米折网十九块九包邮商品,米折网首页每天10点更新,全场米折www.huimizhe.com米折官网19.9元包邮准时开抢,超值十九块邮,独享米折网9.9元包邮
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2024-11-15 23:47 , Processed in 0.146698 second(s), 26 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明