HtmlExtractor网页信息抽取组件

0获赞0粉丝0关注
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件,本身并不包含爬虫功能,但可被爬虫或其他程序调用以便更精准地对网页结
加载更多