大小:53.33M
更新时间:24-11-20
系统:Pc
版本:v10.26
火车头采集器官方版是一款功能强大且易于上手的专业采集软件,也是目前最受欢迎的网页数据采集软件,不仅可以灵活迅速地抓取网页上散乱分布的数据信息,还能够方便快捷的进行互联网上任何数据的获取、处理。
火车头采集器软件界面简洁,功能全面,配备了正文识别、中文分词识别、任意编码识别等多种识别系统,智能识别让操作更轻松,支持Access/MySQL/MsSQL/Sqlite/Oracle多种类型的数据库保存及发布,且不论是图片、压缩文件、视频等任意格式的文件都能轻松下载,还支持接口和插件扩展,满足用户各种采发需求,另外,火车采集器采用了分布式高速采集系统,多个服务端同时运作,解决工作学习中大量的数据下载及使用需求,让您能有更多时间做更多事。
1、几乎所有网页都能采集
无论什么语言,
无论什么编码。
2、和复制/粘贴一样准确
采集/发布如同复制/粘贴一样精准,
用户要的全都是精髓,怎能有遗漏!
3、速度是普通采集器的7倍
火车采集器采用顶级系统配置,
反复优化性能,让采集速度快到飞起来!
4、网页采集的代名词
独具十年历练,成就业界领先品牌,
想到网页采集,就想到火车采集器!
1、在本站下载解压,得到火车头采集器官方版软件包,双击运行"LocoyPlatform.exe"即可直接打开软件;
2、进入首界面之后,点击新建分组,名称和备注可随意写;
3、再点进刚才新建的分组,然后右键创建任务;
4、编辑任务名称,然后添加要采集的目标页面链接;
5、这里选择选择批量/多页采集;
6、网址采集的规则设置:
注意:采集的量根据自己的需求来改
7、点击添加采集规则;
8、然后来进行采集的第二部:内容规则的设置;
9、设置标题替换;
10、配置网站后台的登陆信息和要发布的栏目,然后保存配置 ,全部保存,就OK了,可以正式批量采集文章了。
1、火车头数据采集平台要求,您的电脑必须安装.net framework2.0或2.0以上框架.如果您的采集器打不开,请下载并安装该框架:
附windows .net framework 2.0
2、出现闪退的解决方案:
-火车头根目录有个文件名为AutoUpdate.exe的文件,把这个文件删除掉;
-打开C:\Windows\System32\drivers\etc,编辑hosts文件,添加以下内容:
(如果编辑hosts不生效请关闭安全卫士等软件)
1、无限级多页采集,可以实现无限深度的采集
2、任务队列运行管理,支持Cron表达式
3、无限级分组任务管理,任务回收站功能
4、RSS地址采集功能
5、列表页分页采集获取功能
6、列表页附加参数获取功能
7、列表页及标签XPath可视化提取功能
8、标签纯正则替换功能
9、Http接口查看运行情况
10、导出记录为单个或多个Txt、html 文件
11、标签间自由组合功能
12、针对标签内容继续发送Http请求功能
13、无限级列表网址采集
14、从Http头信息中获取数据
15、标题内容正文提取功能
16、Aspx列表分页自识别
17、多网站站群式web发布
18、导出记录为Word格式
19、导出所有记录为Excel格式
20、使用随机二级代理服务器(支持Socket代理)
21、多扩展间数据交换功能
22、下载的图片自动加增强型水印功能
23、Ocr识别(图片转化为文字)
24、Http接口管理采集器运行
25、Mongodb数据库保存数据
26、主从服务器分布式采集
1、火车采集器有什么功能?
火车采集器能够为您实现数据的采集发布、互联网数据挖掘、批量下载海量数据、舆情监控等多种功能,是助您充分利用网页数据的最佳工具。
2、什么是火车采集器的服务年限?
服务年限是指在相应的年限时间里可以免费升级到火车采集器发布的最新版本并享有VIP技术支持服务,购买火车采集器时可以依据个人需求选择服务年限为1年、2年、3年、5年,服务年限到期后用户可通过续费延长年限。
3、绑定机器码,可以随时更换吗?
免费版无需绑定机器码获得授权,基础版和旗舰版机器码版需绑定一台机器码,可免费更换一次;
旗舰版自动授权版绑定一台机器码,支持随时自动更换;
企业尊享版绑定三台机器码,可免费更换三次。另附赠两个加密狗,不限更换机器。
企业豪华版绑定六台机器码,不限更换次数。附赠四个加密狗,不限更换机器。
v10.26版本
1、新增:文件上传支持华为云上传
2、新增:保存为本地TXT文件时,支持自定义扩展名,比如.ini,.py等等
3、新增:HTML标签过滤排除支持自定义过滤标签
4、新增:http请求头列表支持剪切板批量粘贴导入头信息设置
5、新增:POST分页设置支持日期参数[yyyyMMdd]
6、优化:火车采集器默认UA更新
7、优化:数据编辑SQL操作界面可随着编辑界面伸缩放大
8、修复:下载图片探测地址问题修复
9、修复:html标签过滤时部分标签不起效问题修复
10、修复:标签提取结果生僻字、繁体字不能查看问题修复
11、修复:数据获取中调用多个标签作为截取字符不起效问题的修复
12、修复:数据转换mysql编码设置无效问题修复
同类热门
猜你喜欢
类似软件
热门标签
网友评论0人参与,0条评论
最新排行
十万水军原创度抄袭检查工具49Kv1.0 水军十万原创度检测工具是一款功能强大的原创度检测软件,又被称之为十万水军原创度抄袭检查工具,该软件是利用搜索引擎来帮助用户文章的原创度检测的,同时伪原创也能精准的帮忙识别,遇到有的关键词在网上出现次数多的即可飘红色标准,这样就很干扰原创度检测准确性
查看