源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

标题: 搜索引擎中文分词原理 [打印本页]

作者: 丘比特    时间: 2013-11-5 00:26
标题: 搜索引擎中文分词原理
1、最小分词法,也即是从小到大把一个关键字切分为不一样的词组,在每一句中找出最小的词组,比方先分红常用的词组:SEO,查找,中文,分词,算法,原理,实战,教程等,然后按分红单个字,开端最小的字与词兼并,比方:中文与分词进行兼并,就呈现了一个最小词组“中文分词”,更多请自个触类旁通。
  2、正方向最小匹配与最大匹配法,比方词组“SEO查找”即是正向最小匹配,“SEO教程”即是最大匹配,相对来最正向最小匹配越小,那么这个关键字的权词就越高,排行就越好,像“SEO分词”就归于中等匹配,像域名愿望SEO训练也一样能够按英语拆分查找引擎优化,my和dream然后组合,中文域名最好用拼音,谷哥则用英语,更多请学会触类旁通
  3、逆向最小匹配与最大匹配法,也即是从右到左的词组匹配办法,由于查找引擎刚依托正向的匹配彻底不能满意用户的需要,所以还查找引擎还需要考虑到逆向匹配,像“中文查找”那么即是逆向的最小匹配,逆向最小匹配往往比正向最大匹配的权重要高一些(这是在一样条件下),“实战SEO”到达最大匹配,词与词的间隔越离,匹配度越低,在一样时刻、资源和本钱的情况下,排行的难度相对比较大,像这些词能够经过在内容中添加彻底匹配的关键字密度、内部锚文本连接和站外连接,使查找引擎十分好的知道页面的主题,像愿望查找引擎优化公益训练的网站标题中彻底没有包括“SEO挣钱训练”这个词,但当用户查找“SEO挣钱”和SEO挣钱训练的时分,依托能够稳定在查找引擎的第一名,这即是内部关键字密度和内连接的弥补方法取得排行,由于愿望SEO训练的外连接十分少。





欢迎光临 源码论坛,商业源码下载,尽在锦尚中国商业源码论坛 (https://bbs.52jscn.com/) Powered by Discuz! X3.3