• [织梦吧]唯一域名:www.dedecms8.com,织梦DedeCMS学习平台.

当前位置: > DedeCMS教程 > DedeCMS安装使用 >

DEDE采集功能的使用 DEDE采集规则的导入与导出的方法

来源: www.dedecms8.com 编辑:织梦吧 时间:2012-01-16点击:

博文正文

DEDE采集功能使用 DEDE采集规则导入与导出的方法

作者:qq598080707   2011-10-28 09:18 星期五 晴

  我们都知道,DEDECMS开发的默认系统后台自带有采集功能,本篇教程演示教你如何使用DEDE采集功能.
  
  采集的定义:
  
  程序按照指定的规则定向获取其他网站数据的一种方式。
  网络采集是用来批量采集网页,论坛等的内容,直接保存到数据库或发布到网站的一种工具,是一个从目标网页中摘取某些数据形成统一的本地数据库的一个过程。   这些数据本来只是在可见的网页中以文本形式存在。这个过程所需要的不仅仅是网页爬行器与网页包装器。一个复杂的数据抽取过程需要应付种种障碍,例如会话识别,HTML表单,客户端Java脚本,以及数据整合问题例如与数据集与单词集不一致的情况,以及缺失和冲突的数据。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容。
  
  详细内容请查阅百度百科采集定义:
  
  
  
  回到重点:DEDE采集规则的导入方法  Dede教程-598080707.NET
  
  1.登录DEDE后台,打开采集栏,点击导入采集规则,如图:
  
  
  
  2.找到已有的DEDE采集规则粘贴到上图方框里,(注意请复制完整的规则进行粘贴,不要漏掉一个字符),粘贴到了之后点确定.下面我就拿这条规则为例: ,如下图:
  
  (如果你不会写采集规则请直接在本站找到你想要的采集内容的采集规则进行粘贴)
  
  DEDE采集规则:?/dede%B2%C9%BC%AF%B9%E6%D4%F2/
  
  
  
  
  
  以上就是采集规则的导入方法了.很简单的两步,中途最容易出错的就是遗漏了规则的字母,导致采集规则不完整所以出错.
  
  3.导入采集规则了之后我们再进行采集操纵了,点击采集节点管理,点击采集进行自动化采集模式.如图:
  
  
  4.正在采集中的演示图:(注意这里采集的速度快慢都取决于你采集规则的采集内容多少来决定,请中途不要关闭浏览器,让其自动采集完成)
  
  
  
  5.你采集完成之后注意右上角有个导出数据,我们点击导出数据,然后进行将采集好的内容数据导出并且自动生成页面,如图:(注:这一步是采集完了之后数据的导出与文档生成)
  
  
  
  
  6.点击确定之后就自动开始导出采集好的数据了,这一步完成之后网站栏目就出现了你刚才采集的内容了.
  
  
  
  到这里采集内容的教程基本就全部完成了.如果你想把采集规则分享给你的朋友的话接着请看下面的操纵:DEDE采集规则的导出方法
  
  点击采集节点管理,点击导出配置,如图:  dede博客-598080707.NET
  
  
  
  点击了导出配置了就如下图了:
  
  
  
  再将以上串码原封不动的复制给你的好友即可.
  
  帖子信息:DEDE技术吧 | 分类:Dede教程 | 本文地址:

分类:ASQQ8.NET | | 浏览:28 | |

分享按钮

下一篇:DEDE把v5.7的编辑器换回以前v5.6版本的编辑器

网友评论:

暂无评论!

发布评论:

About D8

  • ©2014 织梦吧(d8) DedeCMS学习交流平台
  • 唯一网址 www.DedeCMS8.com 网站地图
  • 联系我们 1170734538@qq.com ,  QQ