巧妙运用火车头采集器
- 作者:
- 发表时间:2018-08-29 14:26
- 来源:
采集工具是很多医疗行业或者bc行业最喜欢要的,学习采集工具是他们所必要的。火车头出现的比较早,至于他的使用也在慢慢的更新,使用这个工具也使用了很久。下面来看看具体的操作:
首先直接打开百度:搜索火车头采集器
直接找到下载地方进行下载
直接注册一个账号,在登陆
在程序主界面中,点击“新建”下拉箭头,从中选择“任务”项。
在弹出的窗口中,输入“任务名”,同时点击“起始网址”栏目右侧的“添加”按钮。
接下来就极为重要的一步,就是对要进行采集的网站进行分板,对所采取的网站中各片文章的URL进行综合分析并找出规律,最后按如图进行填写。
然后切换至“第二步:采集内容规则”选项卡中,我们需要对网页内容进行分板。在此以“搜狗浏览器”为例,右击要进行分析的网页,从弹出的菜单中选择“审查元素”项。
在“开发式模式”界面中,点击“选择页面中的一个元素去透视”按钮,接着点击“标题”内容,此时就可以在“开发者”窗口中显示标题所对应的标签,此例为“h2"。
接下来在”采集内容规则“界面中,点击“添加”按钮来添加“标题”项,或者直接双击“标题”项进行修改。在弹出的界面中,勾选”前后截取“,将设置前后辍分别为"<h2>“、”</h2>".
利用同样的方法添加其它采集内容的规则。
切换至“第三步:发布内容设置”选项卡,勾选“启用 方式二”,并进行如图设置。
最后从任务列表中,勾选要采集的内容,点击“开始”按钮就可以按规则采集网站中的网页内容啦。
二老博客所说的这个软件是v8.0的操作,最近版本是v9.0的,他们的区别都差不多的。同时也告诉大家二老博客所说的这个希望对大家有用。
上一篇:怎么来分析网站的百度蜘蛛?
下一篇:2017外链资源,先到先得。
文章推荐:
当你的网站开始被搜索引擎收录了,那么你就要开始通过对网站内容或结构进行优化来提升网站关键词排名,具体要怎么做呢,个人觉得代码的优化是其中非常重要而又非常容易被忽视的一环,今天就和大家谈谈我自己在代码优化...
对于个人网站而言,在建设网站时必不可少的就是虚拟主机,它是指将一台运行在互联网上的服务器划分成一个个虚拟的服务器,每个虚拟主机有独立的域名以及完整的Internet服务器功能,并且不同的虚拟主机价位不同。然而,由...
百度算法也成百度搜索引擎排名算法,做SEO的不可避免和百度打交道,百度算法可以算是几乎每隔一段时间都会对SEOER进行检验,说到排名算法百度算法网站内容,图片,网站标签,页面代码均可对算法造成影响。要做好优化需对...