hdq处理 HTML 文档的 Go+ 工具包

联合创作 · 2023-09-21 23:15

hdq 是用于处理 HTML 文档的 Go+ 工具包。

使用教程

下边是使用 hdq 获取一个 html 页面所有链接的代码示例:

import "github.com/qiniu/hdq"

func links(url interface{}) []string {
	doc := hdq.Source(url)
	return [link for a <- doc.any.a, link := a.hrefVal?:""; link != ""]
}

首先调用hdq.Source(url)创建一个命名为doc的节点集,它只包含一个节点,即根节点。

然后通过doc.any.a选择所有a标签元素,此处的doc.any指的是 html 文档中的所有节点。

然后访问所有a元素,获取href属性值并将其分配给变量link。如果链接非空,则收集它。

最后返回所有收集到的链接。

完整代码查看 tutorial/01-Links

浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报