我们要把采集的数据发布到自定义的数据库里面,本教程通过把数据导入到本地的mysql数据库为例来讲解发布模块的制作。 我们打开数据库发布模块制作工具如下图: 点击“入库”按钮,打开下图: 右击“更多”按...阅读更多
我们要把采集的数据发布到自定义的数据库里面,本教程通过把数据导入到本地的mysql数据库为例来讲解发布模块的制作。 我们打开数据库发布模块制作工具如下图: 点击“入库”按钮,打开下图: 右击“更多”按...阅读更多
也可以把txt文本里面的地址导入到采集器里面,这里注意一下,文本里面的地址是一行一个,然后按照下图点击“浏览”按钮添加文本, 在预览那里查看结果是否正确,然后点击“浏览”按钮旁边的“添加”按钮,然后点击下面的“完成”按钮。 ...阅读更多
这个方法可以一次添加多个地址,这多个地址之间只能有一个变化的部分,并且是按照等差或者等比,或者是字母a-z(区分大小写)变化。 我们经常用的是添加列表的多个分页。比如我们批量添加这个列表分页http://faq.locoy.com/qc-7.html?p=1。 ...阅读更多
起始网址一般是我们采集的入口地址,经常用列表页地址来做为起始页地址, 如下图单条网址添加只要把地址一行一个填写在采集器里面即可,然后点击“添加”按钮,最后点击“完成”按钮。 ...阅读更多
通过采集腾讯新闻为例来说明采集器采集的原理和过程采集新闻的地址是:http://news.qq.com/newssh/shwx/shehuiwanxiang.htm 1,新建一个规则 右击任意分组,选择新建任务如下图: 2,...阅读更多
我们采集内容的时候经常遇到内容里面有图片的,或者我们就采集图片并下载。采集的图片格式有2种: 1,带html标签的 img,这样的情况我们只要在下载设置那里勾选“图片下载”; 2,不带html标签的就单单是采集图片地址,这样的情况在下载设置那里我们要...阅读更多
我们一般都是在第一步采集网址第二步建立标签采集内容其实在第一步采集网址的时候也是可以建立标签采集内容的,也就是采集列表页的内容。 这个功能的使用重点就是找的规律和格式!!!! 我们来采集http://news.qq.com/newsgn/zhxw/s...阅读更多
什么是默认页?什么是多页?假如我们通过采集器采集到了最终内容也地址是http://fsdeshun.cn.1688.com/,然后我们还想点击导航栏上面的“联系方式”进入到联系页地址 http://fsdeshun.cn.1688.com/page/contac...阅读更多
只要给采集器提供RSS地址,采集器就能把内容页地址提取出来,在添加“起始地址” 选择“Rss”选项,把rss地址填写好后,点击“测试”按钮,如果测试的结果是正确的,点击“添加”按 钮,再点击“完成”按钮。 那么就把RSS格式的地址添加成功了,如下图: ...阅读更多