源码论坛公告:本站是一个交流学习建站资源的社区论坛,旨在交流学习源码脚本等资源技术,欢迎大家投稿发言! 【点击此处将锦尚放在桌面

源码论坛,商业源码下载,尽在锦尚中国商业源码论坛

 找回密码
 会员注册

QQ登录

只需一步,快速开始

查看: 1073|回复: 0
打印 上一主题 下一主题

[其他] 利用织梦采集侠的RSS采集功能,采集最新指定关键词新闻

[复制链接]

14

主题

1223

帖子

70

金币

初级会员

Rank: 1

积分
1601
跳转到指定楼层
1#
发表于 2011-7-23 10:06:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  织梦采集侠强大的功能有很多,就连指定站点的采集方式都有两种,一种是根据目标站点提供的RSS进行采集,另一种是页面监控采集,匹配网站页面URL规则,然后进行采集。

      只要获取到文章页面URL,插件就能通过页面智能分析算法,将文章标题,正文内容提取出来,无需编写麻烦的采集规则,而且又能实现定时自动采集文章,经过伪原创seo后发布,被广泛应用在使用织梦cms搭建的网站上,为站长提供帮助。

      不少站长向我反映不懂得怎么查找网站RSS,查找RSS其实很简单的,无非就两种方法,第一种就是通过浏览页面查找有没有RSS相关的链接或者图标,点击进去一般都是RSS;另一种在页面上看不到明显的RSS链接或者标记,但可以通过查看源码获得,打开源码,搜索一下RSS,再仔细查看一下是否是RSS源,而不是其他和RSS有关的内容。

      比如我要采集百度新闻搜索(http://news.baidu.com)中关于“织梦”这个关键词的新闻内容,可以进去百度新闻搜索页面,输入“织梦”点击百度一下,如下图:



      百度新闻搜索不像百度页面搜索那样什么内容都有,百度新闻搜索,只搜索出来是新闻源网站里面和搜索关键词相关的内容,质量相对较高。

      查看这个源码获取RSS地址,可以看到这段代码,其中href之后的,就是RSS地址了,但他没有给出绝对地址,只显示了一个相对地址,不过这些问题难不倒我们站长,我们可以将相对地址补充完整,完整的RSS地址是:

http://news.baidu.com/ns?word=%D ... newsrss&class=0

      然后在插件设置里面,输入这段RSS地址,进行采集就行。具体RSS采集使用方法可以通过这篇教程《织梦采集侠RSS采集/页面监控采集使用方法》进行学习。

      通过RSS采集的方式,可以采集到最新包含该关键词的新闻,做地区新闻站点,做行业站点,只需要输入地区或者行业的名称就能采集到相关的内容,而且还能定时采集,无需站长进入后台点击采集,无需打理网站每天都能保持更新。

采集侠下载地址: http://www.dedeapps.com/Credits-download?invite=1779
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享分享
您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

锦尚中国源码论坛

聚合标签|锦尚中国,为中国网站设计添动力 ( 鲁ICP备09033200号 ) |网站地图

GMT+8, 2025-2-24 16:39 , Processed in 0.081411 second(s), 25 queries .

带宽由 锦尚数据 提供 专业的数据中心

© 锦尚中国源码论坛 52jscn Inc. 非法入侵必将受到法律制裁 法律顾问:IT法律网 & 褚福省律师 锦尚爱心 版权申诉 版权与免责声明