头条二面:你确定ThreadLocal真的会造成内存泄露?

共 2561字,需浏览 6分钟

 ·

2021-09-11 15:09

点击上方“中间件兴趣圈”选择“设为星标”


做积极的人,越努力越幸运!

ThreadLocal,java面试过程中的“钉子户”,在网上也充斥着各种有关ThreadLocal内存泄露的问题,本文换个角度,先思考ThreadLocal体系中的ThreadLocalMap为什么要设计成弱引用

1、ThreadLocal知识体系


本文还是不能免俗,在回答这个问题之前需要先和大家介绍一下ThreadLocal的知识,使大家对ThreadLocal有一个相对全面的认识。

ThreadLocal本地线程变量,主要用于解决数据访问的竞争,通常用于多租户、全链路压测、链路跟踪中保存线程上下文环境,在一个请求流转中非常方便的获取一些关键信息,例如当前的租户信息、压测标记。

ThreadLocal正如其名,本地线程变量,即数据存储在线程自己的局部变量中。

其整体架构如下图所示:

ThreadLocal的核心设计理念总结如下:
  • 每一个线程对象会维护一个私有属性:ThreadLocal.ThreadLocalMap threadLocals。

  • ThreadLocalMap内部结构为Key-Value键值对,其Key为ThreadLocal对象,Value为调用ThreadLocal的set方法设置的值。

一言以蔽之:ThreadLocal是将线程需要访问的数据存储在线程对象自身中,从而避免多线程的竞争

2、为什么会被设计为弱引用呢?


接下来我们来看一下ThreadLocalMap的声明:


什么?Map中的用于存储键值对的Entry为什么要继承WeakReference?

思考这个问题之前先和大家普及一下Java的4种引用类型,主要是在垃圾回收时java虚拟机会根据不同的引用类型采取不同的措施。

  • 强引用:java默认的引用类型,例如 Object a = new Object();其中 a 为强引用,new Object()为一个具体的对象。一个对象从根路径能找到强引用指向它,jvm虚拟机就不会回收。

  • 软引用(SoftReference):进行年轻代的垃圾回收不会触发SoftReference所指向对象的回收;但如果触发Full GC,那SoftReference所指向的对象将被回收。备注:是除了软引用之外没有其他强引用引用的情况下

  • 弱引用(WeakReference) :如果对象除了有弱引用指向它后没有其他强引用关联它,当进行年轻代垃圾回收时,该引用指向的对象就会被垃圾回收器回收。

  • 虚引用(PhantomeReference) 该引用指向的对象,无法对垃圾收集器收集对象时产生任何影响,但在执行垃圾回收后垃圾收集器会通过注册在PhantomeReference上的队列来通知应用程序对象被回收。

从四种弱引用的实际作用来说,主要是与垃圾回收器配合,决策什么时候可以将被引用的对象回收。

理论看起来有点晦涩难懂,接下来笔者将以图解的方式,争取将该问题阐述清楚。


根据第一部分,声明了一个TheadLocal对象,并且一个线程通过调用threadLocal对象的set(Object value)存储了一个对象,其引用如上图所示。

ThreadLocal的设计比较晦涩难懂,究其原因是我们通过threadLocal对象的set方法进行存储值,但数据并不是存储在ThreadLocal对象中,而是存储在当前调用该方法的线程对象中。但从应用者的角度来看,我们操作的对象是ThreadLocal,从设计上来说就应该为它考虑。

试问一个问题:如果应用程序觉得ThreadLocal对象的使命完成,将threadLocal ref 设置为null,如果Entry中引用ThreadLocald对象的引用类型设置为强引用的话,会发生什么问题?

答案是:ThreadLocal对象会无法被垃圾回收器回收,因为从thread对象出发,有强引用指向threadlocal obj。此时会违背用户的初衷,造成所谓的内存泄露。

由于ThreadLocalMap中的key是指向ThreadLocal,故从设计角度来看,设计为弱引用,将不会干扰用户的释放ThreadLocal意图。

3、大量Entry造成的内存溢出问题探讨


亮出了自己的观点,接下来我们再延伸一下,想再来谈谈网络上关于ThreadLocalMap中存储大量Entry对象导致的内存“泄露”问题。

温馨提示:本节仅代表我当前的观点,希望各位读者朋友们带着批判与辨证的思维来一起看待问题,而不是人云亦云。

网络观点:在使用ThreadLocal中set方法与remove方法需要成对执行,需要没有执行remove方法会造成内存泄露?甚至造成内存溢出?

我的观点:当然能成对使用当然更好,但在实际情况中,其实不调用remove方法也不太容易造成内存溢出,因为从存储结构来看,除非创建海量线程,并且这些线程都不释放,导致大量线程内部持有的ThreadLocalMap中对象一直不会释放,但一个线程所持有的Entry对象个数不多,取决于关联的ThreadLocal对象个数,故我们需要的关注点而不是remove方法,而是防止线程资源泄露

最后推荐一篇关于笔者在实践全链路压测时对ThreadLocal进行的调研与方案。

全链路跟踪(压测)必备基础组件之线程上下文“三剑客”

好了,本文就介绍到这里了,一键三连(关注、点赞、留言)是对我最大的鼓励

这篇文章来自于我的好基友的公众号 「中间件兴趣圈」。


他一个双非背景,通过中间件技术分享,输出12个源码分析专栏,出版《RocketMQ技术内幕》一书,荣获RocketMQ官方社区优秀布道师、CSDN博客之星TOP,在MQ领域有着较大的影响力,他将他日均千亿级消息的MQ运维经验整理成力电子书:



关注公众号「中间件兴趣圈」回复RMQPDF即可免费获取


私人微信我也给你们要来了,可以加他偷窥他的朋友圈,还可以私聊他进技术群,群内有来自不同大厂的N多大佬。


浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报