threadLocal源码解析

2017-11-19 14:35:31

简单记录一个看threadLocal时遇到比较有意思的点。

ThreadLocalMap

ThreadLocal的数据, 存放在Thread的属性ThreadLocal.ThreadLocalMap threadLocals

ThreadLocalMap可以看做一个简单的map, 他保存了每一个ThreadLocal和对应的值.
如有两个ThreadLocal

ThreadLocal<Integer> a = new ThreadLocal<>();
ThreadLocal<Integer> b = new ThreadLocal<>();

在t1线程中设置值:

a.set(1);
b.set(2);

可以想象为t1.threadLocals[a] = 1, t1.threadLocals[b]=2

对于不同的Thread, 每一个Thread中threadLocals分别保存了ThreadLocal和他们对应的值.
如上面栗子中, 如果另一个线程t2也设置了

a.set(3);
b.set(4);

那么可以想象为t2.threadLocals[a] = 1, t2.threadLocals[b]=2

为什么不要直接在ThreadLocal中使用一个map存储对应的线程和值?
如a.map[t1] = 1, a.map[t2] = 3, b.map[t1] = 2, b.map[t2] = 4
我想, 应该是为了方便内存回收.
使用Thread.threadLocals方式, 如果线程结束了, 那该线程set的值(如果没有其他引用)就可以被回收了.
如果使用ThreadLocal.map模式, 已消亡Thread set的值会一直停留在内存中.(map.key会一直指向消亡的Thread)

WeakReference<ThreadLocal<?>>

还有一个值得注意的点, ThreadLocalMap中的数据是存储在Entry[] table中,
Entry的定义是

static class Entry extends WeakReference<ThreadLocal<?>> {
    // 这个valu就是ThreadLocal.set的值
    Object value;

    Entry(ThreadLocal<?> k, Object v) {
        super(k);
        value = v;
    }
}

注意这里使用了WeakReference, 而不是Entry extends ThreadLocal<?>.
WeakReference引用表明, 一旦没有指向 referent 的强引用, weak reference 在 GC 后会被自动回收.

先看一个小栗子:

Thread t = Thread.currentThread();

ThreadLocal<Object> local = new ThreadLocal<>();

Object reference = new Object();

local.set(reference);

local.get();

// 去掉强引用
local = null;   // 代码1
System.gc();

System.out.println(t);  // 代码2

要通过debug查看Thread.threadLocals的情况.
debug到代码1处, 可以看到

debug到代码2处, 可以看到

可以看到, gc后, entry的referent被回收了, 这时ThreadLocal可以被内存回收了, 如果使用
Entry extends ThreadLocal<?>, 那么entry.key会一直引用ThreadLocal, 导致ThreadLocal无法被回收.
那么除了内存回收, 使用WeakReference还有没有其他意义呢?

我们可以看一下ThreadLocalMap的实现, ThreadLocalMap的数据存放在Entry[] table数组中, 通过hash算法实现一个类Map的数据结构,就来看一下ThreadLocalMap.set方法

private void set(ThreadLocal<?> key, Object value) {
    Entry[] tab = table;
    int len = tab.length;
    // 计算hash值
    int i = key.threadLocalHashCode & (len-1);

    // 找到可以set的位置
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        ThreadLocal<?> k = e.get();

        if (k == key) {
            e.value = value;
            return;
        }

        if (k == null) {
            replaceStaleEntry(key, value, i);
            return;
        }
    }

    // set 值
    tab[i] = new Entry(key, value);
    int sz = ++size;
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();   // 扩容
}

关键在查找可以set的位置上, 使用hash算法无可避免会遇到hash冲突, 常见的解决方法,
如链路法, 在该位置使用一个链路存储多个冲突的值(HashMap的方法),
这里使用的是线性补偿探测法, 发生冲突是, 使用当前位置继续进行hash计算(nextIndex(i, len)方法), 直到找到一个可以使用的位置.

上面栗子中,

  • 如果entry为null, 可以直接创建entry放置到该位置.
  • 如果entry.referent(就是entry指向的ThreadLocal) == key, 可以直接替换掉value
  • 如果entry.referent==null, 这就是上面提到的, referent指向的ThreadLocal没有强引用了,所以referent被GC回收了, 既然这时ThreadLocal没有引用了, 所以这里就可以考虑替换该entry了, 不用再继续寻找合适的位置了.

所以这里使用WeakReference, 还有一个意义就是减少hash冲突.

看到这里, 不得不说ThreadLocal的实现, 还真是”有点意思”啊

错误之处, 还望指出