善肯网页TXT采集器

善肯网页TXT采集器

大小:896K

更新时间:24-04-08

系统:Pc

版本:v1.0

开始下载

善肯网页TXT采集器是一个专业的网页文本采集工具,,可以帮助用户一键提取网页中的所有文字,总是有很多朋友喜欢在网页上看小说,看到好看的章节你可以使用善肯网页TXT采集器,它可以让你在抓取小说的时候获得更加快速的速度,让你可以在看到喜欢看的小说的时候更加的简单!

使用帮助

1、规则设置

在规则设置窗口,在网站中随便找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。

规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。

规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。

关于替换,有通用替换和定制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置\n再作为替换数据的时候代表换行。

编码,目前只设置有GBK和UFT-8,差不多大多数网站就是这两种编码其中之一。

2、解析与下载

解析请按解析地址2按钮

支持单章节下载和全文下载。

支持添加章节数【有的小说没有章节数的时候就可以勾上】

支持在线看,但是需要联网,此功能只是辅助,并非专业的看小说软件。

下载进度和总需时间显示,内置多线程。

3、关于软件

其实只要.exe就行,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则,主要是测试的时候是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。

软件没加壳,c#开发的,没放病毒。不放心请不要用,我不背锅。

关于软件里面有个www.52pojie.cn跳转到论坛,我个人测试跳转的时候被360提示了,也有可能是因为跳转的是360浏览器,不知道你们会不会有这个问题。

xml里面的内容,如果不清楚的话还是不要动它,免得软件识别失败报错。

需要.NET Framework 4.5或者及以上版本框架支持,如果你电脑没有的话,需要下载安装,框架不大的。

软件特色

【操作简单】

完全可视化图形操作,无需专业IT人员,任何会使用电脑上网的人都可以轻松掌握。

【云采集】

采集任务自动分配到云端多台服务器同时执行,提高采集效率,可以很短的时间内 获取成千上万条信息。

【拖拽式采集流程】

模拟人的操作思维模式,可以登陆,输入数据,点击链接,按钮等,还能对不同情况采取不同的采集流程。

【图文识别】

内置可扩展的OCR接口,支持解析图片中的文字,可将图片上的文字提取出来。

【定时自动采集】

采集任务自动运行,可以按照指定的周期自动采集,并且还支持最快一分钟一次的实时采集。

【2分钟快速入门】

内置从入门到精通所需要的视频教程,2分钟就能上手使用,另外还有文档,论坛,qq群等。

应用信息

语言简体中文

同类热门

快手直播伴侣电脑版快手直播伴侣电脑版 YY开播电脑版YY开播电脑版 v5多开器win10版本v5多开器win10版本 变速齿轮游戏加速器变速齿轮游戏加速器 Find.Same.Images.OK(重复图片查找软件)Find.Same.Images.OK(重复图片查找软件) 哔哩哔哩投稿工具哔哩哔哩投稿工具 Subtitle Edit绿色中文版Subtitle Edit绿色中文版 polyv直播助手polyv直播助手

猜你喜欢

电脑爬虫软件大全

在互联网信息时代,很多朋友们都会选择在网上收集自己需要的信息,想要快速的收集各种信息的话,就需要使用到相关爬虫工具了,通过爬虫软件我们就可以自动收集自己想要的数据信息,能够节约大量的手动时间,但是爬虫软件有哪些呢?小编今天就在此给大家提供了电脑爬虫软件大全,这些软件都是操作十分简单的,不需要用户会相关的技术就能够直接操作,无论是老手还是新手都适用,对此有兴趣的小伙伴们可以来下载体验。

共有 11 款软件全部>>

类似软件

热门标签

富士施乐打印机驱动大全 市面上主流的电脑浏览器 php代码编辑器大全 电脑屏幕录制软件大全 罗技鼠标驱动大全 游戏录制软件大全 电脑微信多开免费软件 程序员常用编程软件大全 希沃软件电脑版合集 c++编程开发软件大全 cad字体大全 电脑视频剪辑软件大全

网友评论0人参与,0条评论

评论需审核后才能显示

最新排行

手游排行软件排行热门应用