深入理解Java内存模型的语义

前言

Java内存模型(JMM)给我们介绍了在当代不同的硬件架构情况下,多线程程序需要关注什么问题以及如何利用JMM来正确的处理这些问题。

多线程带来的问题

多线程程序主要关注两个问题:

(1)共享变量可见性问题

(2)代码重排序一致性问题

Java内存模型的关键点

JMM已经保证了as-if-serial原则,也就是Java的程序在单线程情况下,不管JIT做不做重排序,也不管代码指令在几个CPU上执行,看到的最终结果必须和代码顺序执行的结果保持一致。

但是在多线程的情况下,如何才能正确的处理的变量可见性问题和重排序的一致性问题?

关键在于理解和运用下面的两块内容:

(1)happens-before相关

(2)data race相关

关于Memory Consistency Errors

Memory Consistency Errors中文含义是:内存一致性错误,指的的是多线程环境下,对于同一个共享变量的值在不同的线程看到的视图不一致。

伪代码如下:

int counter = 0;

此时A线程正在执行:

counter++;

然后过了几秒后,B线程打印这个值:

System.out.println(counter);

此时B线程的打印结果很大可能是0,但A线程里面其实这个值已经是1了,这就是典型的内存一致性错误。这情况种只能通过happens-before规则来避免。

关于happens-before

happens-before是JMM里面保证在一个线程里面执行的action(读或者写)的结果,可以在随后的其他线程里面立马可见的一系列规则。比如 x happens-before y ,那么不管x和y是不是在同一个线程里面,JMM都会保证对于x的update都会立马里面对y线程可见,也就是x总会先于y执行,前提是两者必须有happens-before关系,否则就会出现上面的内存一致性错误的问题。

如何建立happens-before关系? 这里面有几条规则:

(1) 单线程中的程序执行结果与代码的顺序执行结果保持一致。

你能会好奇,难道单线程不是顺序执行的吗? 答案是的确不一定按照顺序执行,这个跟硬件的指令重排序有关,目的是为了优化性能让cpu更快的执行指令,但有happens-before保证,所以结果跟代码顺序执行的结果保持一致,这是最基础的保证,也是最重要的保证。

(2)同一个锁的unlock操作,在其他线程lock后,变量是可见的。

class LockRule {
    private int value = 0;

    public synchronized void setValue(int value) {
        this.value = value;
    }

    public synchronized int getValue() {
        return value;
    }
}

也就是在A线程中执行setValue操作,在B线程中执行getValue方法是可以看到变化的,注意这里一定是同一个监视器才可以,比如上面这段代码就是用对象做为监视器。此外ReentrantLock锁也具有相同的语义。

(3)volatile修饰的变量,在一个线程update后,立刻对其他的线程可见。这个不多说,前面的文章介绍过。

(4)关于Thread的start方法,是指在一个线程A中启动另外另外一个线程B时,A里面所有的变量对B是可见的,最常见的就是我们在java的main线程中启动的线程是可以看到启动之前所有的main线程的变量的。底层是启动前把所有内容都同步到主内存里面了,然后新的线程会从主内存里面拷贝一份数据到自己的cache,所以是可见的。

(5)关于Thread的join方法,同样道理,比如我在java的main线程里面声明了一个线程B,然后调用 B.start() //启动B线程 B.join() //main线程等待B线程结束 此时在B线程里面修改了成员变量,在B线程结束的时候,main线程是可以直接看到最终变化的。这是一个线程结束的时候会把自己缓存的值给刷新到主内存,所以感知了B线程结束的主线程是可以看到所有变化的。

(6)关于Thread的interrupt方法,同样道理,在java的main线程中,比如我在java的main线程里面声明了一个线程B,然后调用 B.start() //启动B线程 B.interrupt() //打断B线程,此时B线程的是可以看到主线程的修改的状态

(7)对于实例的finalize()方法,当实例的构造方法执行完毕之后,如果再执行finalize()方法,此时实例里面的所有变量不管有多少线程修改过对finalize()方法都是可见的。

(8)传递性规则: 如果 A happens-before B 并且 B happens-before C, 那么 A happens-before C

关于data race

data race又叫数据竞争,在这里指的多个线程之间没有符合的happens-before规则,但是它们又需要修改同一个共享变量,比如上面的counter的例子,最终会造成内存一致性的问题,这种情况下可以通过Java自带的一些锁机制来避免。

关于上篇文章遗留问题

在上篇文章中,我遗留了一个问题,那就在下面的代码中:

    private  static boolean  keepRunning=true;

    public static void main(String[] args)  throws Exception {

        new Thread(
                ()->{

                    while (keepRunning){
                        //System.out.println();
                    }
                }

        ).start();

        Thread.sleep(1000);
        keepRunning=false;

    }

如果我把while循环里面的打印语句去掉,那么即使没有volatile关键字,程序也可以结束循环,为什么? 其实答案就在今天的知识里面,因为打印语句会锁住当前的实例,源码如下:

    public void println(boolean x) {
        synchronized (this) {
            print(x);
            newLine();
        }
    }

对应到上面的happens-before的第二条规则就很容易的解释通了。

总结

本篇文章主要介绍了Java内存模型主要描述的问题以及解决多线程环境下的问题思路,我们了解和学习了什么是内存一致性错误,happens-before的规则,数据竞争的内容,掌握了这些知识将非常有助于我们深入到Java并发编程的世界,希望大家可以有所收获。

Top