java虚拟机与计算机内存是如何协同工作的

冬至子 2023-06-09 1626

电子说

1.4w人已加入

描述

介绍

为了屏蔽各种硬件和操作系统的内存访问差异，以实现让java程序在各种平台下都能达到一致的并发效果，java虚拟机规范中定义了java内存模型，简称JMM。java内存模型规范了java虚拟机与计算机内存是如何协同工作的，它规定了一个线程如何和何时可以看到其他线程修改过的共享变量的值，以及在必须时如何同步地访问共享变量。

一、jvm内存分配结构

处理器

java中的堆是运行时的数据区域，堆的优势是可以动态的分配内存大小，生存期也不必事先告诉编译器，垃圾回收机制负责回收不再使用的数据，缺点是由于运行时动态分配内存，因此存取速度相对慢一些。
栈的优势是存取数据比堆要快一些，仅次于计算中的寄存器，栈的数据是可以共享的。缺点是存在栈中的数据的生存期以及大小必须是确定的，缺乏一些灵活性。栈中主要存放一些基本类型的变量。
java内存模型要求调用栈和本地变量存放在线程栈上，对象存放在堆上。具体说下，一个本地变量，也有可能指向一个对象的引用，这种情况下，引用这个本地变量是存放在线程栈上，但是对象本身是存放在堆上的。一个对象包含方法，方法中的本地变量是存放在线程栈上的，即使这些方法所属的对象存放在堆上。一个对象的成员变量可能随着对象自身存放在堆上，不管这个成员变量是原始类型还是引用类型。静态成员变量跟随着类的定义一起存放在堆上，存在堆上的对象可以被所持有这个对象引用的线程访问。
当一个线程可以访问这个对象的时候，它也可以访问这个对象的成员变量。如果两个线程同时调用同一个对象上的同一个方法，他们就会都访问这个对象的成员变量，但是每一个线程都拥有了这个成员变量的私有拷贝

二、多核并发缓存架构

处理器

计算机在寄存器上执行的速度是远大于在主内存上执行的速度；
由于计算机的存储设备与处理器的运算速度之间存在几个数量级的差距，所以新的计算机系统都不得不加入一层读写速度都尽可能接近处理器运算速度的高级缓存来作为内存与处理器之间的缓冲，将运算使用到的数据复制到缓存中，让运算快速执行，当运算结束后，再将数据从缓存同步到内存中，这样处理器就无需等待缓慢的内存读写了。
一个计算机还包含一个主存，所有的cpu都可以访问这个主存，主存通常比CPU中的缓存大得多。
多核cpu运作原理：

通常情况下，当一个CPU需要读取主存的时候，它会将主存的数据读取到CPU缓存中，甚至会将缓存中的部分内容读到它内部的寄存器里面，然后在寄存器中执行操作；当CPU需要将结果回写到主存的时候，它会将内部寄存器的值刷新到缓存中，然后在某个时间点将值刷新回主存。

jvm内存分配结构与cpu多核并发缓存架构直接的关联

处理器

硬件架构没有区分线程栈和堆，对于硬件架构来说所有的线程栈和堆都分布在主内存中，部分的线程栈和堆可能有时候会出现在CPU缓存中，和CPU内部的寄存器里面

三、java内存模型

处理器

线程之间共享变量存储在主内存中，每一个线程都有一个私有的本地内存（工作内存），本地内存是java内存模型的一个抽象的概念，不是真实存在的，它涵盖了缓存，写缓冲区，寄存器，以及其他的硬件和编译器的优化。本地内存中它存储了该线程以读或写共享变量的拷贝的一个副本。
从更低的角度说，主内存就是硬件的内存，是为了获取更好的运行速度，虚拟机以及硬件系统可能会让工作内存优先存储于寄存器和高速缓存中。
java内存模型中线程的工作内存是CPU的寄存器和高速缓存的一个抽象的描述，而JVM的静态内存存储模型（jvm内存模型），它只是一种对内存的物理化分而已，它只局限在JVM的内存。
线程A和线程B通信必须要经过下面两个步骤：
- 线程A需要将本地内存A中更新过的共享变量刷新到主内存里面；
- 线程B去主内存中读取线程A之前更新过的共享变量
Java的多线程之间是通过共享内存进行通信的，而由于采用共享内存进行通信，在通信过程中会存在一系列如可见性、原子性、顺序性等问题，而JMM就是围绕着多线程通信以及与其相关的一系列特性而建立的模型。JMM定义了一些语法集，这些语法集映射到Java语言中就是volatile、synchronized等关键字。

四、java内存模型同步的八种指令操作

处理器

lock（锁定）：作用于主内存的变量，把一个变量标识为一条线程独占状态。
unlock（解锁）：作用于主内存的变量，把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定。
read（读取）：作用于主内存的变量，把一个变量值从主内存传输到线程的工作内存中，以便随后的load动作使用。
load（载入）：作用于工作内存的变量，它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
use（使用）：作用于工作内存的变量，把工作内存中的一个变量传递给执行引擎。每当虚拟机遇到一个需要使用到的变量的值得字节码指令时，就会执行这个操作。
assign（赋值）：作用于工作内存的变量，它把一个从执行引擎接收到的值赋值给工作内存的变量。每当虚拟机遇到一个给变量赋值的字节码指令时会执行这个操作。
store（存储）：作用于工作内存的变量，把工作内存中的一个变量值传送的主内存中，以便随后的write的操作
write（写入）：作用于主内存的变量，它把store操作从工作内存中一个变量的值传送到主内存的变量中。

对应的java内存模型的同步规则：

如果要把一个变量从主内存中复制到工作内存，就需要按顺序地执行read和load操作，如果把变量从工作内存中同步回主内存中，就要顺序地执行store和write操作。但java内存模型只要求上述操作必须顺序执行，而没有保证必须是连续执行。
不允许read和load、store和write操作之一单独出现。
不允许一个线程丢弃它的最近assign的操作，即变量在工作内存中改变了之后必须同步到主内存中。
不允许一个线程无原因地（没有发生过任何assign操作）把数据从工作内存同步回主内存中。
一个新的变量只能在主内存中诞生，不允许在工作内存中直接使用一个未被初始化（load或assign）的变量。即就是对一个变量实施use和store操作之前，必须先执行过了assign和load操作。
一个变量在同一时刻只允许一条线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才会被解锁。lock和unlock必须成对出现。
如果对一个变量执行lock操作，将会清空工作内存中次变量的值，在执行引擎使用这个变量前需要重新执行load或assign操作初始化变量的值。
如果一个变量事先没有被lock操作锁定，则不允许对他执行unlock操作；也不允许去unlock一个被其他线程锁定的变量。
对一个变量执行unlock操作之前，必须先把此变量同步到主内存中（执行store和write操作）。

五、案列分析

下面我们结合java内存模型分析下共享变量执行i++的操作流程：

处理器

初始化共享变量i=0。
线程1通过read指令从主内存中读取出共享变量i=0，通过load指令加载到线程1的工作内存中。
在线程1的工作内存中，通过use指令将共享变量i=0加载到cpu执行引擎进行+1计算，计算后共享变量i=1。
在线程1的工作内存中，通过assign指令将cpu执行引擎计算后的共享变量i=1赋值到线程1的工作内存中。
线程1通过store指令将线程1中工作内存的共享变量同步到主内存中。
在线程1的主内存中，通过write指令将共享变量i=1的值赋值给主内存的该共享变量，从而完成一次i++操作。
那么当线程1还未将共享变量的值同步赋值回写到主内存时，线程2开始进行了i++操作，线程2通过read指令读取到的共享变量i的值此时还是0，那么线程2又在0的基础进行了i++操作。所以当很多线程并发执行i++操作时，结果是与我们预期不符的。
以上结合java内存模型分析了我们共享变量的一个执行流程。解释了i++操作是一个线程不安全的。

结语

上一篇我们分析了java并发包中cas的原理，这篇总结下cas涉及到的java内存模型的原理，cas还涉及到的cpu缓存一致性协议，我们后面继续分析。

打开APP阅读更多精彩内容