Go垃圾回收、三色标记原理,终于能跟面试官扯皮了!

编程三分钟

共 2142字,需浏览 5分钟

 ·

2021-09-18 17:19

垃圾回收(Garbage Collection,简称 GC)是编程语言中自动的内存管理机制,垃圾指的是不再需要的内存块,如果不及时清理就没有办法再利用。如果不回收会占用越来越多的内存内存

垃圾回收算法

常见的垃圾回收算法有:

引用计数:每个对象维护一个引用计数,如果这个对象被销毁,则计数 -1 ,当计数为 0 时,回收该对象。

  • 优点:对象可以很快被回收,不会出现内存耗尽或到达阀值才回收。
  • 缺点:不能很好的处理循环引用

标记-清除:从根变量开始遍历所有引用的对象,引用的对象标记“被引用”,没有被标记的则进行回收。

  • 优点:解决了引用计数的缺点。
  • 缺点:需要 STWstop the world),暂时停止程序运行。

分代收集:按照对象生命周期长短划分不同的代空间,生命周期长的放入老年代,短的放入新生代,不同代有不同的回收算法和回收频率。

  • 优点:回收性能好
  • 缺点:算法复杂

Go 语言的 GC(垃圾回收)怎么做的呢!我们来版本讨论

标记-清除(mark and sweep)

此算法是在 Go V1.3 之前使用的,主要有两个主要的步骤:标记(Mark phase)—>清除(Sweep phase)。

1、暂停程序业务逻辑, 找出不可达的对象,然后做上标记。

注意:mark and sweep 算法在执行的时候,需要程序暂停!也就是所谓的 STW(stop the world)。这段时间程序会卡住,一会细讲。

程序可达对象为 124

2、开始标记,找出所有可达的对象,并标记

对象 124 做上标记

3、清除未被标记的对象

4、程序暂停取消。然后重复上面的过程,直至程序生命周期结束。

三色并发标记法

此算法是在Go V1.5 开始使用的,三色只是为了叙述上方便抽象出来的一种说法,实际上对象并没有颜色之分。这里的三色,对应了垃圾回收过程中对象的三种状态:

  • 灰色:对象还在标记队列中等待
  • 黑色:对象已被标记,该对象不会在本次 GC 中被清理
  • 白色:对象未被标记,该对象将会在本次 GC 中被清理

步骤一、初始状态下所有对象都是白色的。

步骤二、从根节点开始遍历所有对象,把遍历到的对象变成灰色对象(备注:这里变成灰色对象的都是根节点的对象)。

步骤三、遍历灰色对象,将灰色对象引用的对象 (备注:这里指的是灰色对象引用到的所有对象,包括灰色节点间接引用的那些对象) 也变成灰色对象,然后将遍历过的灰色对象变成黑色对象。

步骤四、循环步骤三,直到灰色对象全部变黑色

步骤五、通过写屏障(write-barrier)检测对象变化,重复以上操作(备注:因为 mark 和用户程序是并行的,所以在上一步执行的时候可能会有新的对象分配,写屏障是为了解决这个问题引入的)。

步骤六、收集所有白色对象(垃圾)。

最后、上面的垃圾回收结束之后,GC 会在进行一步操作,也就是将黑色对象重新变色成白色对象,供下一次垃圾回收使用。

Stop The World

刚刚提到了GC过程中会停止程序运行,这种行为叫 STWStop The World)在Go中是停掉所有的 goroutine,专心做垃圾回收,待垃圾回收结束后再恢复 goroutine

STW 时间的长短直接影响了应用的执行,时间过长对于一些 web 应用来说是不可接受的,这也是广受诟病的原因之一。

为了缩短 STW 的时间,Golang 不断优化垃圾回收算法,这种情况得到了很大的改善。

垃圾回收优化

写屏障(Write Barrier)

STW 目的是防止 GC 扫描时内存变化而停掉 goroutine,而写屏障就是让 goroutineGC 同时运行的手段。虽然写屏障不能完全消除 STW,但是可以大大减少 STW 的时间。

写屏障类似一种开关,在 GC 的特定时机开启,开启后指针传递时会把指针标记,即本轮不回收,下次 GC 时再确定。

GC 过程中新分配的内存会被立即标记,用的并不是写屏障技术,也即 GC 过程中分配的内存不会在本轮 GC 中回收。

辅助 GC(Mutator Assist)

为了防止内存分配过快,在 GC 执行过程中,如果 goroutine 需要分配内存,那么这个 goroutine 会参与一部分 GC 的工作,即帮助 GC 做一部分工作,这个机制叫作 Mutator Assist

垃圾回收触发时机

1、每次内存分配时都会检查当前内存分配量是否已达到阀值,如果达到阀值则立即启动 GC。内存增长率由环境变量 GOGC 控制,默认为 100,即每当内存扩大一倍时启动 GC
阀值 = 上次GC内存分配量 * 内存增长率

2、默认情况下,最长 2 分钟触发一次 GC

3、程序代码中也可以使用如下命令来手动触发 GC。主要用于 GC 性能测试和统计。

runtime.GC()

 有什么问题,可以公众号内回复或加我微信交流。

NEW////ARRIVAL

微信公众号

gophpython

我的微信

wucs_dd

浏览 50
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报