学学 Go1.18 新 IP 包的设计思路
共 4563字,需浏览 10分钟
·
2021-12-09 13:09
阅读本文大概需要 10 分钟。
大家好,我是 polarisxu。
Go 1.18 标准库新增了一个包:net/netip,大部分人可能用不上这个包,但这个包的设计思路以及和现有标准库 IP 的比较值得学习。
01 标准库 net.IP 的问题
前 Go Team 成员之一 Brad Fitzpatrick 加入 Tailscale[1] 后,经常需要操作 IP 地址。因为使用 Go 语言实现的,自然会使用过标准库的 net.IP 和 net.IPNet 等类型。但他们认为标准库的相关类型有很多问题,所以他们自己写了一个包:https://github.com/inetaf/netaddr。
早在 2017 年 1 月,Brad Fitzpatrick 就提了 issue,认为 net.IP 的设计存在问题:https://github.com/golang/go/issues/18804,那时他还在 Go Team。
具体来说,net.IP 存在如下几个问题:
可变的。net.IP 的底层类型是 []byte,它的定义是: type IP []byte
,这意味着你可以随意修改它。不可变数据结构更安全、更简单。不可比较的。因为 Go 中 slice 类型是不可比较的,也就是说 net.IP 不支持 ==
,也不能作为 map 的 key。有两个 IP 地址类型,net.IP 表示基本的 IPv4 或 IPv6 地址,而 net.IPAddr 表示支持 zone scopes 的 IPv6。因为有两个类型,使用时就存在选择问题,到底使用哪个。标准库存在两个这样的方法: Resolver.LookupIP
vsResolver.LookupIPAddr
。(关于什么是 IPv6 zone scopes 见维基百科:https://en.wikipedia.org/wiki/IPv6_address#Scoped_literal_IPv6_addresses_(with_zone_index 。)太大。在 Go 中,64 位机器上,slice 类型占 24 个字节,这只是 slice header。因此,net.IP 的大小实际包含两部分:24 字节的 slice header 和 4 或 6 字节的 IP 地址。而 net.IPAddr 更有额外的字符串类型 Zone 字段,占用空间更多。 不是 allocates free 的,会增加 GC 的工作。当你调用 net.ParseIP 或接收一个 UDP 包时,它为了记录 IP 地址会分配底层数组的内存,然后指针放入 net.IP 的 slice header 中。 当解析一个字符串形式的 IP 地址时,net.IP 无法区分 IPv4 映射的 IPv6 地址[2]和 IPv4 地址。因为 net.IP 不会记录原始的地址族(address family)。见 issue 37921[3] 它是一种透明类型(transparent type)。因为它的定义是: type IP []byte
,底层类型是一个字节切片。这有什么问题呢?我们没法改变 IP 的底层类型了,因为它已经是导出 API 的一部分。标准库中一个很好的例子是 time.Time 类型,它是一个不透明类型:type Time struct { /* unexported */ }
,也就是里面有什么没公开,这样库作者可以随便修改里面的内容,只需要保证导出 API 不变即可。实际上 Go1.9 就改过一次 time.Time 的内部结构,完全不会破坏兼容性。
但为了兼容性,以上这些问题没法通过改进 net.IP 类型解决。于是才有了 Brad Fitzpatrick 上面开发的包。该包已经正式合入 Go1.18 标准库中,这就是 net/netip 包,这里可以查看包文档:https://pkg.go.dev/net/netip@master。
02 net/netip 包设计思路
新的 netip 包定义了一个 IP 地址(Addr)类型,它是一个小值类型。基于该 Addr 类型,该包还定义了 AddrPort(一个 IP 地址和一个端口)和 Prefix(一个 IP 地址和一个位长前缀)。
与 net.IP 类型相比,netip 包的 Addr 类型占用更少的内存(24 byte),不可变(immutable),并且具有可比性(支持 == 并作为 map 键)。(本文基于 64 位机器讲解)
该包的具体 API 等信息可以查看文档,这里着重讲解 netip 的设计思路。(来自 Brad Fitzpatrick 的文章)
net.IP 类型的特性:
基于此,netip 包的演进过程中,有几种设计。
1)wgcfg.IP,查看具体代码[4]。
// Internally the address is always represented in its IPv6 form.
// IPv4 addresses use the IPv4-in-IPv6 syntax.
type IP struct {
Addr [16]byte
}
这种结构相比 net.IP 结果:
可见还存在几个问题:1)无法区分 IPv4 和 IPv6;2)不支持 IPv6 zone。而不透明可以通过将字段 Addr 改为 addr 解决。
2)netaddr.IP,查看具体代码[5]。
不知道大家是否知道,Go 中的 interface 是可比较的(即可通过 ==
比较和用作 map 的键,不过如果接口的底层值是不可比的,则运行时会 panic)。利用这一点,设计了 netaddr.IP 类型:
type IP struct {
ipImpl
}
type ipImpl interface {
is4() bool
is6() bool
String() string
}
type v4Addr [4]byte
type v6Addr [16]byte
type v6AddrZone struct {
v6Addr
zone string
}
该结构的对比:
这种结构存在的问题:不够小(20-23 byte),不是 Allocation free。
因此继续优化。
3)allocation-free 24 字节表示
为什么定为 24 字节?Go 标准库中 net.IP 的 Slice Header 大小是 24 字节,而 Go 中 Slice 很常见。time.Time 类型的大小目前也是 24 字节。所以,Go 编译器肯定能够很好的处理 24 字节值类型。所以,tailscale 团队定了目标,要求表示 IP 的类型不超过 24 字节。
由于 IPv6 地址已经占去 16 个字节,因此剩下 8 字节用于编码以下内容:
地址族(v4、v6 或两者都不是,例如 IP 零值),至少需要 2 位 IPv6 zone
此外,还需要能比较。
剩下的内容只能占 8 字节,因此没法使用 interface{}(它占用 16 字节),字符串也不行(16 字节)。
可以尝试采用了 bit-packing 的方式:
type IP struct {
addr [16]byte
zoneAndFamily uint64
}
将地址族和 IPv6 zone 打包(packing)进 zoneAndFamily 字段中(8 字节)。不过这种方式编码不是太方便,可能还会有一些问题。
最后采用了指针的方式:
type IP struct {
addr [16]byte
z *intern.Value // zone and family
}
具体的过程分析可以参考 https://tailscale.com/blog/netaddr-new-ip-type-for-go/。
这样可以定义三个哨兵:
var (
z0 *intern.Value // nil for the zero value
z4 = new(intern.Value) // sentinel value to mean IPv4
z6noz = new(intern.Value) // sentinel value to mean IPv6 with no zone
)
这接近最终实现。不过,基于此有进一步的优化,感兴趣的可以阅读上面参考文章以及 Go1.18 的 net/netip 实现。
03 总结
这个包你可能用不到,不过标准库中之前的 IP 实现的问题,以及新 IP 类型的设计思路还是值得认真看一下的。对其中更多细节感兴趣的,可以认真研读这篇文章:https://tailscale.com/blog/netaddr-new-ip-type-for-go/。
参考资料
Tailscale: https://tailscale.com/
[2]IPv4 映射的 IPv6 地址: https://en.wikipedia.org/wiki/IPv6#IPv4-mapped_IPv6_addresses
[3]issue 37921: https://github.com/golang/go/issues/37921
[4]具体代码: https://github.com/tailscale/wireguard-go/commit/89476f8cb53b7b6e3e67041d204a972b69902565#diff-d6e6f254849cb9119d9aaa21a41ee7f26f499251ce073522bdd89361a316814bR13
[5]具体代码: https://github.com/inetaf/netaddr/commit/7f2e8c8409b7c27c5b44192839c8a94fca95aa21#diff-5aea5a23fd374194efa71dd12c8ddf8ede924f1043045520a8283d2490f40f12R27
我是 polarisxu,北大硕士毕业,曾在 360 等知名互联网公司工作,10多年技术研发与架构经验!2012 年接触 Go 语言并创建了 Go 语言中文网!著有《Go语言编程之旅》、开源图书《Go语言标准库》等。
坚持输出技术(包括 Go、Rust 等技术)、职场心得和创业感悟!欢迎关注「polarisxu」一起成长!也欢迎加我微信好友交流:gopherstudio