Html2ArticleHtml网页正文提取

0获赞0粉丝0关注
.NET平台下,一个高效的从Html中提取正文的工具。正文提取采用了基于文本密度的提取算法,支持从压缩的Html文档中提取正文,每个页面平均提取时间为
简介
.NET平台下,一个高效的从Html中提取正文的工具。正文提取采用了基于文本密度的提取算法,支持从压缩的Html文档中提取正文,每个页面平均提取时间为30ms,正确率到95%以上。Html2Article有如下特点:标签无关,提取正文不依赖标签。支持从压缩的html文档中提取正文内容。支持带标签输出... 更多
其它信息
地区
国产
开发语言
C#
开源组织
所属分类
Web应用开发、 HTML解析器
授权协议
Apache
操作系统
Windows
收录时间
2023-09-21
软件类型
开源软件
适用人群
未知

时光轴

里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
图片
表情
全部评价( 0)
推荐率 100%
推荐