使用Go语言时,谨防锁拷贝!

共 5423字,需浏览 11分钟

 ·

2021-08-10 00:33

via:

https://eli.thegreenplace.net/2018/beware-of-copying-mutexes-in-go/

作者:Eli Bendersky

相信大家对 Go 语言的锁拷贝问题并不陌生,那我们应该如何规范使用Go 语言才能规避这个问题呢?一起来看作者是如何处理的。

原文如下:


假设我们有一个包含 map 的结构体,现在想在方法中修改这个 map,看下面的例子[1]

package main

import "fmt"

type Container struct {
  counters map[string]int
}

func (c Container) inc(name string) {
  c.counters[name]++
}

func main() {
  c := Container{counters: map[string]int{"a"0"b"0}}

  doIncrement := func(name string, n int) {
    for i := 0; i < n; i++ {
      c.inc(name)
    }
  }

  doIncrement("a"100000)

  fmt.Println(c.counters)
}

Container 包含一个计数器集合,按 name 区分。inc() 会按 name 对相应的计数器执行自增操作(假设计数器存在)。main() 里循环多次调用 inc()。

执行上面的代码,输出:

map[a:100000 b:0]

现在假设有两个 goroutine 会并发地调用 inc()。因为我们必须小心竞争条件,所以使用了 Mutex 保护临界区。

package main

import (
  "fmt"
  "sync"
  "time"
)

type Container struct {
  sync.Mutex                       // <-- Added a mutex
  counters map[string]int
}

func (c Container) inc(name string) {
  c.Lock()                         // <-- Added locking of the mutex
  defer c.Unlock()
  c.counters[name]++
}

func main() {
  c := Container{counters: map[string]int{"a"0"b"0}}

  doIncrement := func(name string, n int) {
    for i := 0; i < n; i++ {
      c.inc(name)
    }
  }

  go doIncrement("a"100000)
  go doIncrement("a"100000)

  // Wait a bit for the goroutines to finish
  time.Sleep(300 * time.Millisecond)
  fmt.Println(c.counters)
}

你期望上面这段代码会输出什么呢?我得到的结果是这样的:

fatal error: concurrent map writes

goroutine 5 [running]:
runtime.throw(0x4b765b0x15)

<...> more goroutine stacks
exit status 2

我们使用 mutex 时已经很小心了,怎么还会出问题呢?你觉得应该如何修复这个问题?提示:只需要改动一个字符的代码就可以了!

代码的问题在于,无论何时调用 inc(),c 都会是一份拷贝,因为 inc() 是定义在 Container 上,而非 *Container;换句话说,c 是值接受者,而不是指针接受者。因此,inc() 并不能真正修改 c 的内容。

但等等,文章第一个示例是如何工作的?在单协程的例子中,c 也是按值传递,但是为什么能得到正确的结果 -- 在 inc() 在对 map 所做的修改,能影响到 main() 函数的原始值。这是因为 map 是引用类型而非值类型。Container 里保存的是指向 map 的指针,而不是 map 实际的数据。所以即使我们创建 Container 的副本,counters 保存的仍是指向 map 的地址。

所以文章第一个例子也是存在问题的,尽管执行结果没有问题,但是使用方法不符合官方指南[2] - 在方法中对原始数据进行修改,则方法应定义成指针方法,而非值方法。这里对 map 的使用给了我们一种错误的提示。作为练习,可以将第一个示例中的 map 换成 int 类型的计数器,并注意观察 inc() 的副本是如何递增的,在 inc() 中对副本做的修改不会影响到 main() 中的原始值。

Mutex 是值类型(可以看 Go 文档[3]相关的定义,包括注释里也明确地提示不能拷贝),复制再使用是错误的。复制仅仅是创建了一个新的 mutex,很显然地,对计数器的互斥使用就失效了。

所以应该这样修改,定义 inc() 方法时在 Container 之前添加 *:

func (c *Container) inc(name string) {
  c.Lock()
  defer c.Unlock()
  c.counters[name]++
}

c 通过指针方式传到方法中,指向的 Container 与 main() 函数里面的是同一个。

这个问题并不罕见,事实上,使用 go vet 命令就会发现这个问题:

go tool vet method-mutex-value-receiver.go
method-mutex-value-receiver.go:19: inc passes lock by value: main.Container

在我看来,实际上这个问题帮助我们理清了值接收者与指针接收者之间的区别。为了说明这一点,下面还有一个示例,这个示例与上面两个示例没有关系。这个示例使用到了 & 取值符和 %p 格式化输出变量的地址。

package main

import "fmt"

type Container struct {
  i int
  s string
}

func (c Container) byValMethod() {
  fmt.Printf("byValMethod got &c=%p, &(c.s)=%p\n", &c, &(c.s))
}

func (c *Container) byPtrMethod() {
  fmt.Printf("byPtrMethod got &c=%p, &(c.s)=%p\n", c, &(c.s))
}

func main() {
  var c Container
  fmt.Printf("in main &c=%p, &(c.s)=%p\n", &c, &(c.s))

  c.byValMethod()
  c.byPtrMethod()
}

执行代码后输出(如果在你的机器上执行,输出的地址可能不同,但是这不影响说明问题):

in main &c=0xc00000a060, &(c.s)=0xc00000a068
byValMethod got &c=0xc00000a080, &(c.s)=0xc00000a088
byPtrMethod got &c=0xc00000a060, &(c.s)=0xc00000a068

main() 函数里创建了 Container 变量 c,并且输出它的地址和它的成员 s 的地址,接着调用了 Container 的两个方法。byValMethod() 是值接受者,因为是原值的拷贝所有打印的地址不一样。另一方面,byPtrMethod() 是指针接收者,输出的地址与 main() 函数输出的地址一致,因为调用时获取的是 c 实际的地址,而不是副本。

参考资料

[1]

例子: https://github.com/eliben/code-for-blog/tree/master/2018/go-copying-mutex

[2]

官方指南: https://golang.org/doc/faq#methods_on_values_or_pointers

[3]

Go 文档: https://golang.org/src/sync/mutex.go



推荐阅读


福利

我为大家整理了一份从入门到进阶的Go学习资料礼包,包含学习建议:入门看什么,进阶看什么。关注公众号 「polarisxu」,回复 ebook 获取;还可以回复「进群」,和数万 Gopher 交流学习。

浏览 41
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报