源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 566|回复: 0
打印 上一主题 下一主题

[转载] 早期的关于对搜索引擎的认识

[复制链接]

400

主题

400

帖子

408

金币

初级会员

Rank: 1

积分
1096
QQ
跳转到指定楼层
1#
发表于 2013-12-2 09:28:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  早期的关于对SEO搜索引擎的熟悉    早期的关于对搜索引擎的认识
  搜索引擎作为人们普遍使用的信息检索工具搜罗多个规模的手艺和理论,如数据挖掘、信息检索、人工智能等,上网站数据挖掘技术为搜索引擎的个性化供给了强年夜的技术。
  1 浅谈网站 数据挖掘技术
  (1)“网站数据挖掘”的简称是“网站挖掘”,它一项综合技术,涉及到的领域稀有据挖掘、网站、信息学、计较机说话学等。其本色是从网站勾当、网站文档中抽取用户感乐趣的、潜匿信息、潜在的有用模式。网站挖掘可以采用于良多方面,例如网站文档分类、成立网站元数据库、确定权威页面、挖掘搜索引擎的结构等。
  (2)根基事理:网站数据挖掘是对网页内容和机关相关的方针数据集进行预措置、模式发现和剖析的过程,其中目的数据集指的是按照用户的要求从网站资本 中提取的相关数据。预处置赏罚是把冗余的数据和较着错误的数据从目标数据集中除去从而对所选数据的有效部门进行精简,将数据转换成为有效形式。按照使命要求进行更有效模式的数据开采,选用合适的数据开采算法,追求用户感爱好的数据模块,并用恰当的体例表告竣易于理解的形式。对发现的模式进行评估息争释是由模式说明完成,需要时需要返回之前的轨范做数据的一再提取。这些程序完成之后,会将最后发现的常识供给给用户。 /
  (3)网站数据挖掘是基于收集进行的,其过程分为四个首要步骤:确定营业对象、数据筹备、数据挖掘、结构分析,其挖掘体式格局包孕网站结构挖掘、网站内容挖掘、网站使用记实挖掘。
  (4)联系关系轨则技术、分类聚类技术、序列模式技术以及特有的路径分析技术是网站数据挖掘中常用的数据挖掘技术。
  2 关于搜索引擎
  (1)其工作原理是运行一个Robot程序,搜索引擎遍历所有的网页是依据链接进行的,把汇集到的网页放入到网页信息库中,然后凭证必然的划定礼貌创立索引。若是用户在搜索引擎中输入自己感兴趣主题的关头词,搜索引擎就会进行索引,索引所用到的就是先前创设好的单词纪录网页库,最后检索出知足用户需求的前提网页返回给用户。
  (2)搜索引擎在“用户功能”主要存在的问题如下:切确率低且无关信息的查询功效太多,返回成百上千甚至数万条信息的现象经常呈现,提供的信息针对性不强;显示挨次杂乱、有效性差也是查询成就常见的问题,例如搜索成效涉及到文献、广告、新闻等等方面的,其排序没有按信息分类进行;在个性化处事、自然语言理解、查询方式和查全率等方面存在的问题也急需解决。 /
  3 搜索引擎中网站数据挖掘技术的应用
  (1)建树兴趣关联规则及展望用户行为实现客户端网站数据挖掘。kjsfdskjj1202
  客户端中搜索引擎进行文档检索查找是根据用户提出的查询请求的字符串进行的,这个查询在索引数据库中完成的,而且做好查询内容与文档的相关度的工作,接着按照某种算法排序即将输出的查询后果,同时实现某种用户相关性反馈机制。用户浏览需要查询下场的网页时辰,为了提高网页获取的速度,可以使用智能网站预取技术,具体方法是在暗示用户浏览器缓冲区域数据的时刻应用合适的数据模子,把用户的兴趣关联规则应用数据挖掘技术挖掘出来,接着把这些数据设置在兴趣关联知识库数据中,用来猜测用户行为。高速缓冲实时是浏览器常用的技术之一,它包含的历史数据可以反映用户访谒网页过程中的兴趣快乐喜爱。操作数据模型来描述高速缓冲区域的页面链接。哄骗数据挖掘技术中的关联规则和数据模型技术相连系很大水平上优化了客户端处搜索引擎技术。 /
  (2)获取有效的网页内容和确立精简的索引数据库实现服务器端网站 数据挖掘。http://tongxinghang.com
  网页信息库实时改良和调整要搜集内容的依据是网络蜘蛛所搜集到的网页和网站数据挖掘的效果。那么,这样就要求网络蜘蛛程序的拥有更高的功能,网络蜘蛛程序需要具备依据数据挖掘的结果实现动态更新的功能,进行数据筛选和抽取时要按照事先给定的数据结构。数据挖掘中,寻找网页信息库中的值的相关性应用的是关联分析技术;应用分类方法分析进行网页信息库中的网站数据的分析,能够为每个类别实现数据分心模型设立建设、分类规则挖掘、做出正确的描述,此外分类其他数据库中的记录也要应用这个类别规则来进行;应用聚类方法对网页信息库中的记录数据进行分析,也就是对记录集结进行合理的规划要根据一定的分类规则,对每个记录地址的类别进行确定。经由过程这个轮回过程,精辟出一个集成度高、易于使用、冗余度地的索引数据库,这样的数据库便行使户信息检索查找。http://fifbo.com
  4 结语网络信息数据量很是复杂、增添越来越快,想要利便的找到有价值的、合适人们要求的信息,使搜索结果达到最优,还有许多工作要做。网站数据挖掘技术在搜索引起的应用起到了很大的敦促浸染,还需要不竭深切研究。http://hszhfuke.com
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2024-11-16 19:25 , Processed in 0.145937 second(s), 26 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明