Gumbo纯C语言实现的HTML5解析库

联合创作 · 2023-09-21 23:36

Gumbo 是 Google 的一款用C语言实现的HTML5解析库,无需任何外部依赖。

目标及特征:

  • 遵循 HTML5 规范

  • 功能强大,可处理一些不规范的 HTML 标签

  • 简单的 API

  • 支持源位置和指针回到原始文本

  • 轻巧、没有外部依赖

  • 通过 html5lib-0.95 兼容测试

  • 已在超过25亿个来自谷歌索引的页面中进行过测试

示例代码:

#include "gumbo.h"

int main(int argc, char** argv) {
  GumboOutput* output = gumbo_parse(argv[1]);
  // Do stuff with output->root
  gumbo_destroy_output(&kGumboDefaultOptions, output);
}
浏览 9
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报