善肯网页文本采集器 绿色电脑版v1.0
善肯网页TXT采集器完全可视化图形操作,无需专业IT人员,任何会使用电脑上网的人都可以轻松掌握。
采集任务自动分配到云端多台服务器同时执行,提高采集效率,可以很短的时间内 获取成千上万条信息。
模拟人的操作思维模式,可以登陆,输入数据善肯网页文本采集器,点击链接,按钮等,还能对不同情况采取不同的采集流程。
在规则设置窗口,在网站中随便找一篇文,不写任何规则,先点击实时预览,看看能不能获取网页源代码,能获取则再写规则,不能获取就没必要继续了。
规则设置使用的是正则表达式匹配内容,有一定基础最好,没基础也可以参考给的范例,简单学习下,不需要深入学习正则。
规则设置的时候,目录页和内容页需要分开预览,也就需要两个链接,一个目录页链接、一个内容页链接。
关于替换,有通用替换和定制替换,这里目前不需要正则,普通替换就好,需要注意的是必须要输入值,空格也行。删除:选中整行,再按住delete键就行。内置\n再作为替换数据的时候代表换行。
其实只要.exe就行,规则全是自己添加,commonrule.xml里面是通用替换规则。网站规则在rule文件夹下。我这边在里面放了两个网站的规则绿色电脑版v1.0,主要是测试的时候是用的。其他网站规则,大家可以自己添加,或者支持开发者也行。
关于软件里面有个跳转到论坛,我个人测试跳转的时候被360提示了,也有可能是因为跳转的是360浏览器,不知道你们会不会有这个问题。
需要framework 4.5或者及以上版本框架支持,如果你电脑没有的话,需要下载安装,框架不大的。
本站资源均收集整理于互联网,其著作权归原作者所有,如果有侵犯您权利的资源,请来信告知,我们将及时撤销相应资源。