简介
GoldDataSpider 是用于抓取网页和抽取数据的工具。其核心代码是从金色数据抓取融合平台分离而来。该项目提供抓取和抽取来自网页数据,不仅可以抽取网页内的内容,还能抽取URL、HTTP报头、Cookie里的数据。该项目定义了一种简洁、灵活、敏捷的结构或者说是规则语法。极尽其所能将网页内容、HT... 更多
其它信息
地区
国产
开发语言
Groovy
开源组织
无
所属分类
应用工具、 网络爬虫
授权协议
Apache
操作系统
跨平台
收录时间
2023-09-29
软件类型
开源软件
适用人群
未知
时光轴
里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%
推荐
Krabber网页抽取工具
Krabber是kVitrail的网页抽取工具。Krabber的设计目标是提供一个可以为Java应用调用的、可以执行网页上的JavaScript代码、并返回JavaScript代码执行后的网页的HTM
Krabber网页抽取工具
0
Wandora数据抽取工具
Wandora是一个通用的数据提取,管理和发布应用程序,基于主题地图和基于Java的。Wandora有一个图形用户界面,知识层次的介绍,几个数据存储选择,丰富的数据提取,进口和出口能力,以及一个嵌入式
Wandora数据抽取工具
0
HttpWatch网页数据分析工具
HttpWatch是一款强大的网页数据分析工具.集成在InternetExplorer工具栏.包括网页摘要.Cookies管理.缓存管理.消息头发送/接受.字符查询.POST数据和目录管理功能.报告输
HttpWatch网页数据分析工具
0
cx-extractor通用网页正文抽取
基于行块分布函数的通用网页正文抽取:线性时间、不建DOM树、与HTML标签无关对于Web信息检索来说,网页正文抽取是后续处理的关键。虽然使用正则表达式可以准确的抽取某一固定格式的页面,但面对形形色色的
cx-extractor通用网页正文抽取
0