图解 Go pprof 收集数据的工作流

共 2731字,需浏览 6分钟

 ·

2020-12-26 15:59

点击上方蓝色“Go语言中文网”关注,每天一起学 Go

Illustration created for “A Journey With Go”, made from the original Go Gopher, created by Renee French.

ℹ️ 本文基于 Go 1.13。

pprof 是用于分析诸如 CPU 或 内存分配等 profile 数据的工具。分析程序的 profile 数据需要收集运行时的数据用来在之后统计和生成画像。我们现在来研究下数据收集的工作流以及怎么样去调整它。

工作流

pprof 以一个固定的时间间隔基础来收集数据,这个时间间隔是以每秒的收集器的个数定义的。默认参数是 100,即 pprof 每秒收集 100 次数据,例如,每 10 毫秒收集一次。

可以通过调用 StartCPUProfile 来启动 pprof

func main() {
 f, _ := os.Create(`cpu.prof`)
 if err != nil {
  log.Fatal(err)
 }
 pprof.StartCPUProfile(f)
 defer pprof.StopCPUProfile()

 ...
}

这个过程会在运行的线程中自动设置一个定时器(下图中 M 表示线程),让 Go 定期地收集 profile 数据。下面是第一个示意图:

想了解更多关于 MPG 调度模型的信息,我推荐你阅读我的文章”Go:协程,操作系统线程和 CPU 管理[1]。“

然而,目前为止 pprof 仅在收集当前运行的线程的 profile 信息。当 Go 调度器想调度一个协程运行在某个线程上时,这个线程也可以实时被追踪。下面是更新后的示意图:

想了解更多关于 Go 调度器的信息,我建议你阅读我的文章”Go: g0,特殊的协程[2]“。

之后,profile 数据会在定义好的每个时间间隔到期后定期地被 dump 到一个缓冲区:

数据实际上是由 gsignal 进行 dump 的,这个协程是用来处理发来的信号的。实际上,在每个时间间隔到期后定时器会发送信号。

想了解更多关于信号和 gsignal 的信息,我推荐你阅读我的文章”Go:gsignal,信号的掌控者[3]“。

基于信号的机制

在每个线程上创建的定时器是由 settimer 方法和时间间隔定时器 ITIMER_PROF 管理的。时间计数仅在系统代表这个处理运行时才会减少,这样就能确保 profile 数据的准确。

当经过了定义的时间间隔后,定时器发送一个 SIGPROF 信号,这个信号会被 Go 截获,profile 数据会被 dump 到缓冲区。频率可以通过调用 runtime 包里的 SetCPUProfileRate 函数进行配置。这个配置操作需要在启动 profiler 之前完成:

func main() {
 f, err := os.Create(`cpu.prof`)
 if err != nil {
  log.Fatal(err)
 }

 runtime.SetCPUProfileRate(10)
 pprof.StartCPUProfile(f)
 defer pprof.StopCPUProfile()

 ...
}

profile 数据采集率只能定义一次,在启动 profiler 时 pprof 定义它。在启动 profiler 之前调用该方法会导致 pprof 忽略默认值。

然而,默认值能满足大部分场景中。包的文档中有对此的详细解释:

100 Hz 是合理的值:既能满足产出有用数据的频率需求,又不至于过快而使系统 hang 住。

当然,更高的频率值似乎也可以,因为它可能会导致一些 `SIGPROF` 事件[4]250 或更高的值降下来。pprof 文档也陈述了怎样让它表现得更好:

[…] 实践中操作系统不能以比 500 Hz 更高的频率触发信号

收集数据

现在所有的定时器都已经设置完了。当数据被 dump 到缓冲区后,pprof 需要一种把所有数据收集起来生成报告的方法。这个处理过程是在独立的协程中进行的,每 100 毫秒收集和格式化一次数据。至于收集到的数据,Go 生成回溯信息,用来找到函数调用关系以及处理它来格式化内联调用。

当信息生成过程完成后,例如 profile 数据收集结束后,特定的协程会把报告 dump 到文件,这样数据就可用和完全可视化了。


via: https://medium.com/a-journey-with-go/go-samples-collection-with-pprof-2a63c3e8a142

作者:Vincent Blanchon[5]译者:lxbwolf[6]校对:unknwon[7]

本文由 GCTT[8] 原创编译,Go 中文网[9] 荣誉推出

参考资料

[1]

Go:协程,操作系统线程和 CPU 管理: https://studygolang.com/articles/25292

[2]

Go: g0,特殊的协程: https://medium.com/a-journey-with-go/go-g0-special-goroutine-8c778c6704d8

[3]

Go:gsignal,信号的掌控者: https://studygolang.com/articles/28974

[4]

SIGPROF 事件: https://github.com/golang/go/issues/35057

[5]

Vincent Blanchon: https://medium.com/@blanchon.vincent

[6]

lxbwolf: https://github.com/lxbwolf

[7]

unknwon: https://github.com/unknwon

[8]

GCTT: https://github.com/studygolang/GCTT

[9]

Go 中文网: https://studygolang.com/



推荐阅读


福利

我为大家整理了一份从入门到进阶的Go学习资料礼包,包含学习建议:入门看什么,进阶看什么。关注公众号 「polarisxu」,回复 ebook 获取;还可以回复「进群」,和数万 Gopher 交流学习。

浏览 14
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报