/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
网络神采免费版是一款非常好用的网页数据采集工具,软件小巧便携,绿色无需安装,操作简单,能够帮助用户一键进行各类网站的数据采集工作。
《网络神采》是一款轻量级的采集软件,用于快速采集、下载网页数据。软件速度快、好用、免费。支持智能采集(不用配规则)、可视化采集(不用看源文件),支持二次开发、分布式部署。为用户的大数据分析、信息化平台,提供稳定、持续、准确的数据资源。
1、采集强度
网络神采官方版支持JS解析、POST分页、登录采集、跨层采集。对于疑难采集页面,有成熟的解决方案。
2、速度快
网络神采官方版是一款十分优秀的采集软件,网络神采官方版体积不大,但是功能非常的好用,可以快速采集、下载网页数据。并且支持智能采集、可视化采集,支持二次开发、分布式部署。支持多任务同时运行,每个任务又可以设置多线程,确保运行效率。
3、规模化
支持任务多级分类、批量管理。支持云服务器分布式部署,管理员团队协合。
4、流程化
支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集、信息处理。
5、运行稳定
系统运行稳定,要求“0 bug”。目标网页改版后,自动通知管理员。
6、准确性
定制好任务后,采集准确率可达100%,即一条不漏。
A、通用:根据制定采集规则,可以采集任何通过浏览器看得到的东西。
B、灵活:支持网站登录采集、网站跨层采集、POST采集、脚本采集、动态页面采集等高级功能。
C、扩展性强:支持存储过程调用、插件调用等,可以通过二次开发扩展功能。
D、高效:为了让用户节省一分钟去做其它事情,对软件做了精细设计。
E、速度快:速度最快、效率最高的采集软件。
F、稳定:系统资源占用少、有详细的运行报告、采集性能稳定,而且,软件要求“零BUG”。
G、人性化:注重软件细节,在乎用户体验。
1、下载完成后不要在压缩包内运行软件直接使用,先解压;
2、软件同时支持32位64位运行环境;
3、如果软件无法正常打开,请右键使用管理员模式运行。
1、增加定期重启软件功能。
2、修复bug:定时采集启动任务时会进队列2次。
3、增加设置:特殊结果设置 -> 记录任务名称。
4、修复bug:Win7下启动服务IO异常。
5、按任务统计插件。
6、修复bug:文本查看器切换到空白单元格会出错。
7、如果不下载文件,不要再生成子目录(即使选中设置)。
8、F9运行文件夹下所有任务后,子文件夹的任务状态没有改变。
9、修复bug:访问休息间隔设置为“0-1秒”时失效。
10、处理JS中的相对地址时,可识别“'”前面的转义符“”。
11、发生 Worker Thread Error 的异常时,可记录异常的详细内容。
12、读取网址时出错后,可暂停任务。
13、发生 Worker Thread Error 的异常时,任务可暂停;若暂停失败,则停止任务。
14、修复bug:继续任务时,如果任务进入任务队列,则会重新开始任务。
15、停止任务,同样要写日志。
16、改进了任务队列的查询算法。
17、改进了机器码的可读性。
18、Worker Thread Error: 引发类型为“System.OutOfMemoryException”的异常。该异常发生后,可暂停任务。
19、保存“提取网址”时如果出错,可恢复。
20、增加设置:如果“使用插件处理采集结果数据行”失败(即返回“false”),仍显示采集结果。
21、废弃设置:关闭软件时,如果有软件正在运行,强制停止所有任务。
22、改进“源文件查看器”用户体验3处:Cookie变化、粘贴POST参数时自动分离、菜单快捷键。
23、捕获地址时,如果某个参数有变化,文本框背景色则变红。
24、将检查“关键规则”调整到“采集结果筛选”之前。
25、更新插件接口(IBget 3.4),更新内容:CheckSchedule、Create 新增参数:lastTaskState、lastPausingReason。
26、请求休息间隔,支持随机数。
27、请求重试可以设置为无限次数,同时增加“重试休息间隔”、“重试错误范围”设置。
28、任务增加设置:动作失败后不暂停任务。
29、下载文件时,只请求一次。
30、运行整个文件夹的任务时,增加快捷键:F9。
31、修复bug:批量暂停正在启动的任务时,会有“运行中”状态闪过。
32、解决:运行信息窗口资源释放问题。
33、使用插件处理结果数据行后,如果返回false,则数据行不再显示。
34、循环采集拆分字符串数组时,保留空值。
35、修复内存bug一处。
36、修复bug:查看等待区出错:集合已修改;可能无法执行枚举操作。
37、修复bug:由于插件日志回调事件,会引发异常:远程对象已断开。
38、修复bug:设置窗口如果不操作,2分钟后会抛异常:远程对象已断开。
39、更新插件接口(IBget 3.3),更新内容:ExtractResult 新增参数:rowIndex;Create 新增参数:supportAsyncCall。
40、创建插件时如果出错,任务不再提示连接数据库。
41、特殊结果 -》 记录当前网址,如果有POST参数,则包含在其中。
42、修复bug:任务完成后取消定时采集,在选中“使用插件检查定时采集”时仍起作用。
43、修复bug:源文件查看器预览功能,不能预览框架页。
44、增加复制采集规则功能。
45、提取下一网址时,如果与网址队列重复,则提示:提取 n 条, 已去重.
46、连续提取下一层网址失败已达到 n 次后,不再提取下一页网址,不然下次请求时会重复提取。
47、修复几处内存溢出问题。
48、修复bug:文本查看器 html 方式查看,关闭窗口后,再打开出错“未将对象引用设置到实例”。
49、改进定时采集检查思路:取当前时间并缓存,这样就没有了定时偏差。
数据采集软件有哪些?数据采集软件顾名思义是一款可以帮助用户快速将想要的相关数据快速搜集整理的辅助工具。各行各业都需要进行数据的采集,淘宝需要采集买家的数据信息,互联网也需要才采集用户的信息,现在是大数