源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 678|回复: 0
打印 上一主题 下一主题

[交流] 搜索引擎中文分词原理

[复制链接]

100

主题

106

帖子

1

金币

初级会员

Rank: 1

积分
76
QQ
跳转到指定楼层
1#
发表于 2013-11-5 00:26:55 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1、最小分词法,也即是从小到大把一个关键字切分为不一样的词组,在每一句中找出最小的词组,比方先分红常用的词组:SEO,查找,中文,分词,算法,原理,实战,教程等,然后按分红单个字,开端最小的字与词兼并,比方:中文与分词进行兼并,就呈现了一个最小词组“中文分词”,更多请自个触类旁通。
  2、正方向最小匹配与最大匹配法,比方词组“SEO查找”即是正向最小匹配,“SEO教程”即是最大匹配,相对来最正向最小匹配越小,那么这个关键字的权词就越高,排行就越好,像“SEO分词”就归于中等匹配,像域名愿望SEO训练也一样能够按英语拆分查找引擎优化,my和dream然后组合,中文域名最好用拼音,谷哥则用英语,更多请学会触类旁通
  3、逆向最小匹配与最大匹配法,也即是从右到左的词组匹配办法,由于查找引擎刚依托正向的匹配彻底不能满意用户的需要,所以还查找引擎还需要考虑到逆向匹配,像“中文查找”那么即是逆向的最小匹配,逆向最小匹配往往比正向最大匹配的权重要高一些(这是在一样条件下),“实战SEO”到达最大匹配,词与词的间隔越离,匹配度越低,在一样时刻、资源和本钱的情况下,排行的难度相对比较大,像这些词能够经过在内容中添加彻底匹配的关键字密度、内部锚文本连接和站外连接,使查找引擎十分好的知道页面的主题,像愿望查找引擎优化公益训练的网站标题中彻底没有包括“SEO挣钱训练”这个词,但当用户查找“SEO挣钱”和SEO挣钱训练的时分,依托能够稳定在查找引擎的第一名,这即是内部关键字密度和内连接的弥补方法取得排行,由于愿望SEO训练的外连接十分少。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2024-11-17 04:43 , Processed in 0.133486 second(s), 26 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明