运行时数据区内部结构
JVM为什么需要运行时数据区:
内存是非常重要的系统资源,是硬盘和CPU 的中间仓库及桥梁,承载着操作系统和应用程序的实时运行。JVM内存布局(运行时数据区)规定了Java在运行过程中内存申请、分配、管理的策略,保证了JVM的高效稳定运行。


Java虚拟机定义若干种程序运行期间会使用到的运行时数据区,其中有一些会随着虚拟机启动而创建,随着虚拟机退出而销毁。另外一些则是与线程一一对应的,这些与线程对应的数据区域会随着线程开始和结束而创建和销毁。
线程私有:程序计数器、虚拟机栈、本地方法栈。
线程间共享:堆、方法区(永久代或元空间、代码缓存)
程序计数器:(PC寄存器)English:Program Counter Register
作用:
pc寄存器用来存储指向下一条指令地址,也即将要执行的指令代码。由执行引擎读取下一条指令
因为CPU需要不停的切换各个线程 所以就涉及到一些线程调度,当cpu暂停运行线程A把时间片让给线程B的时候我们需要保存线程A被暂停执行前的一些现场状态,需要记录当前执行到那一行字节码了,所以具备保存读取下一条指令的功能。

特点:
- 程序计数器占用内存很小,在进行JVM内存计算时,可以忽略不计
- 线程隔离性,每个线程工作时都有属于自己的独立计数器
- 任何时间一个线程都只有一个方法在执行,也就是所谓的当前方法。程序计数器会存储当前线程正在执行的JAVA方法的JVM指令地址,或者执行native本地方法时,程序计数器的值为空(Undefined)因为本地方法是c语言写的
- JVM规范中中唯一一个没有规定OutOfMemoryError(OOM)异常,就是不会发生内存区域超限,无GC
- 它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器来完成

面试问题:
1.为什么要有PC寄存器呢?
因为CPU需要不停的切换各个线程,这时候切换回来以后,就得知道接着从哪开始继续执行。
2.为什么PC寄存器为线程私有的呢?
因为为了能够准确记录各个线程正在执行的当前字节码指令地址,最好的办法自然是为每一个线程都分配一个PC寄存器。
虚拟机栈 (Java栈)
java虚拟机栈是什么
- Java虚拟机栈(Java Virtual Machine Stack),早期也叫Java栈。每个线程在创建时都会一个虚拟机栈,其内部保存一个个的栈帧(Stack Frame),对应着一次次的Java方法调用。
- 线程私有
生命周期:生命周期和线程一致
作用:主管Java程序的运行,它保存方法的局部变量(8种基本数据类型、对象的引用地址)、部分结果,并参与方法的调用和返回。
无GC,存在OOM
面试问题
1.开发中遇见的异常(广义上)有哪些?
Java虚拟机规范允许Java栈的大小是动态的或者是固定不变的。 如何设置java栈固定大小 : -Xss256k(默认为1G)
- 如果采用固定大小的Java虚拟机栈,那每一个线程的Java虚拟机栈容量可以在线程创建的时候独立选定。如果线程请求分配的栈容量超过Java虚拟机允许的最大容量,Java虚拟机将会抛出一个StackOverflowError(栈溢出错误)异常。
- 如果Java虚拟机栈可以动态扩展,并且在尝试扩展的时候无法申请到足够内存,或者在创建新的线程时没有足够的内存去创建对应的虚拟机栈,那Java虚拟机将会抛出一个OutofMemoryError(内存不足错误)异常。
Java虚拟机栈存储的什么呢?
- 每个线程都有自己的栈,栈中的数据都是以栈帧(Stack Frame)的格式存在。
- 在这个线程上正在执行的每个方法都各自对应一个栈帧(方法与栈帧一 一对应)。
- 栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各种数据信息。
栈运行原理:
- JVM直接对Java栈的操作只有两个,就是对栈帧的压栈和出栈,遵循''先进后出''
- 在一条活动线程中,一个时间点上,只会有一个活动的栈帧。即只有当前正在执行的方法的栈帧(栈顶栈帧)是有效的,这个栈帧被称为当前栈帧(Current Frame),与当前栈帧相对应的方法就是当前方法(Current Method),定义这个方法的类就是当前类(Current Class)。
- 执行引擎运行的所有字节码指令只针对当前栈帧进行操作。
- 如果在该方法中调用了其他方法,对应的新的栈帧会被创建出来,放在栈的顶端,成为新的当前栈。

- Java方法有两种返回函数的方式,一种是正常的函数返回,使用return指令;另外一种是抛出异常。不管使用哪种方式,都会导致栈帧被弹出。
栈帧的内部结构

1.局部变量表(Local Variables)
- 局部变量表也被称之为局部变量数组或本地变量表定义为一个数字数组,主要用于存储方法参数和定义在方法体内的局部变量,这些数据类型包括各类基本数据类型、对象引用(reference),以及returnAddress类型。
- 由于局部变量表是建立在线程的栈上,是线程的私有数据,因此不存在数据安全问题.
- 局部变量表所需的容量大小是在编译期确定下来的,并保存在方法的Code属性的maximum local variables数据项中。在方法运行期间是不会改变局部变量表的大小的。
- 方法嵌套调用的次数由栈的大小决定。一般来说,栈越大,方法嵌套调用次数越多。对一个函数而言,它的参数和局部变量越多,使得局部变量表膨胀, 它的栈帧就越大,以满足方法调用所需传递的信息增大的需求。进而函数调用就会占用更多的栈空间,导致其嵌套调用次数就会减少。
- 局部变量表中的变量只在当前方法调用中有效。在方法执行时,虚拟机通过 使用局部变量表完成参数值到参数变量列表的传递过程。当方法调用结束后, 随着方法栈帧的销毁,局部变量表也会随之销毁。


关于Slot的理解
- 参数值的存放总是在局部变量数组的index0开始,到数组长度-1的索引结束。
- 局部变量表,最基本的存储单元是Slot (变量槽)局部变量表中存放编译期可知的各种基本数据类型(8种),引用类型(reference),returnAddress类型的变量。
- 在局部变量表里,32位以内的类型只占用一个slot (包括returnAddress类型),64位的类型(long和double)占用两个slot。byte、short、char在存储前被转换为int,boolean 也被转换为int,0表示false, 非0表示true。long和double 则占据两个Slot。
- JVM会为局部变量表中的每一个slot都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值
- 当一个实例方法被调用的时候,它的方法参数和方法体内部定义的局部变量将会按照顺序被复制到局部变量志中的每一个Slot上
- 如果需要访问局部变量表中一个64bit的局部变量值时,只需要使用前一个索引即可。(比如:访问long或double类型变量)
- 如果当前帧是由构造方法或者实例方法(非静态方法)创建的,那么该对象引用this将会存放在index为0的slot处,其佘的参数按照参数表顺序继续排列。 如图:

注意:
栈帧中的局部变量表中的槽位是可以重用的,如果一个局部变量过了其作用域,那么在其作用域之后申明的新的局部变量就很有可能会复用过期局部变量的槽位,从而达到节省资源的目的。
局部变量和静态变量的总结:
- 参数表分配完毕之后,再根据方法体内定义的变量的顺序和作用域分配。
- 我们知道类变量表有两次初始化的机会,第一次是在“准备阶段”,执行系统初始化,对类变量设置零值,另一次则是在“初始化”阶段,赋予程序员在代码中定义的初始值。
- 变量的分类:按照数据类型分:1.基本数据类型 2.引用数据类型
- 按照在类中声明的位置分:
- ④成员变量:在使用前,都经历过默认初始化赋值
- 类变量: linking的prepare阶段: 给类变量默认赋值---> initial阶段:给类变量显式赋值即静态代码块赋值
- 实例变量:随着对象的创建,会在堆空间中分配实例变量空间,并进行默认赋值
- 局部变量:在使用前,必须要进行显式赋值的!否则,编译不通过(如下图:)
- ④成员变量:在使用前,都经历过默认初始化赋值

3.和类变量初始化不同的是,局部变量表不存在系统初始化的过程,这意味着一旦定义了局部变量则必须人为的初始化,否则无法使用。
补充说明
- 在栈帧中,与性能调优关系最为密切的部分就是前面提到的局部变量表(栈帧中最大的区域)。在方法执行时,虚拟机使用局部变量表完成方法的传递。
- 局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直 接或间接引用的对象都不会被回收。
2.操作数栈(Operand Stack)(或表达式栈)
- 每一个独立的栈帧中除了包含局部变量表以外,还包含一个后进先出(Last-In-First-out)的操作数栈,也可以称之为表达式栈
- 操作数栈,在方法执行过程中,根据字节码指令,往栈中写入数据或提取 数据,即入栈(push)/出栈(pop)。
- 某些字节码指令将值压入操作数栈,其余的字节码指令将操作数取出 栈。使用它们后再把结果压入栈。比如:执行复制、交换、求和等操作
● 操作数栈,主要用于保存计算过程的中间结果,同时作为计算过程中变量 临时的存储空间。
● 操作数栈就是JVM执行引擎的一个工作区,当一个方法刚开始执行的时候, 一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的。
● 每一个操作数栈都会拥有一个明确的栈深度用于存储数值(操作数栈是通过数组实现的),其所需的最大深度在编译期就定义好了,保存在方法的Code属性中,为max_stack的值。
● 栈中的任何一个元素都是可以任意的Java数据类型。.
➢32bit的类型占用一个栈单位深度
➢64bit的类型占用两个栈单位深度
● 操作数栈并非采用访问索引的方式来进行数据访问的,而是只能通过标准 的入栈(push)和出栈(pop)操作来完成一次数据访问。
操作数栈详细介绍链接
3.动态链接(Dynamic Linking)(或指向运行时常量池的方法引用)
- 每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用。 包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接( Dynamic Linking)。比如: invokedynamic指令
- 在Java源文件被编译到字节码文件中时,所有的变量和方法引用都作为符号引用( symbolic Reference)保存在class文件的常量池里。 比如:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。
4.方法返回地址(Return Address)
存放调用该方法的pc寄存器的值。
- 一个方法的结束,有两种方式:
- 正常执行完成
- 出现未处理的异常,非正常退出
无论通过哪种方式退出,在方法退出后都返回到该方法被调用的位置。方法正常退出时,调用者的pc计数器的值作为返回地址。异常退出的,返回地址是要通过异常表来确定,栈帧中一般不会保存这部分信息。
当一个方法开始执行后,只有两种方式可以退出这个方法:
方法正常退出时
1、执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值 传递给上层的方法调用者,简称正常完成出口;
一个方法在正常调用完成之后究竟需要使用哪一个返回指令还需要根据方法返回值 的实际数据类型而定。
在字节码指令中,返回指令包含ireturn(当返回值是boolean、byte、char. short和int类型时使用〉、lreturn、freturn、dreturn以及areturn,另 外还有一个return指令供声明为void的方法、实例初始化方法、类和接口的初始 化方法使用。
(数据类型变化局部变量表一样)
方法异常退出时
2、在方法执行的过程中遇到了异常(Exception),并且这个异常没有在 方法内进行处理,也就是只要在本方法的异常表中没有搜索到匹配的异常处 理器,就会导致方法退出。简称异常完成出口。
方法执行过程中抛出异常时的异常处理,存储在一个异常处理表,方便在发 生异常的时候找到处理异常的代码。
异常处理表 javap -v XX.class 可以理解为try(from to) catch(目标target)

总结:
本质上,方法的退出就是当前栈帧出栈的过程。此时,需要恢复上层方法 的局部变量表、操作数栈、将返回值压入调用者栈帧的操作数栈、设置PC 寄存器值等,让调用者方法继续执行下去。
正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会 给他的上层调用者产生任何的返回值。
5.一些附加信息
栈帧中还允许携带与Java虚拟机实现相关的一些附加信息。例如:对程序调试提供支持的信息。这个可以没有
本地方法栈
Java虚拟机栈用于管理Java方法的调用,而本地方法栈用于管理本地方法的调用。
本地方法栈,也是线程私有的。
允许被实现成固定或者是可动态扩展的内存大小。(在内存溢出方面是相同的)
如果线程请求分配的栈容量超过本地方法栈允许的最大容量,Java虚拟机将会 抛出一个stackoverflowError异常。
如果本地方法栈可以动态扩展,并且在尝试扩展的时候无法申请到足够的内存, 或者在创建新的线程时没有足够的内存去创建对应的本地方法栈,那么Java虚拟机将会抛出一个outofMemoryError异常。
本地方法是使用c语言实现的。
它的具体做法是Native Method stack中登记native方法,在Execution Engine执行时加载本地方法库。

当某个线程调用一个本地方法时,它就进入了一个全新的并且不再受虚拟 机限制的世界。它和虚拟机拥有同样的权限。
➢本地方法可以通过本地方法接口来访问虛拟机内部的运行时数据区。
➢它甚至可以直接使用本地处理器中的寄存器
➢直接从本地内存的堆中分配任意数量的内存。
并不是所有的JVM都支持本地方法。因为Java虚拟机规范并没有明确要求 本地方法栈的使用语言、具体实现方式、数据结构等。如果JVM产品不打 算支持native方法,也可以无需实现本地方法栈。
在Hotspot JVM中, 直接将本地方法栈和虚拟机栈合二为一。
堆
一个进程(一个java程序)对应一个JVM实例,一个JVM实例对应一个自己的方法区和堆 一个进程对应多个线程,每个线程对应一个程序计数器,本地方法栈,虚拟机栈
堆的核心概念
● 一个JVM实例 只存在一个堆内存,堆也是Java内存管理的核心区域。
● Java堆区在JVM启动的时候即被创建,其空间大小也就确定了。是JVM管理的最大一块内存空间。
➢堆内存的大小是可以调节的。
● 《Java虚拟机规范》规定,堆可以处于物理上不连续的内存空间中,但在逻辑上它应该被视为连续的。
● 所有的线程共享Java堆,在这里还可以划分线程私有的缓冲区(Thread Local Allocation Buffer, TLAB) 。
● 《Java虚拟机规范》中对Java堆的描述是:所有的对象实例以及数组都应当在运行时分配在堆上。(The heap is the run-time data area from
which memory for all class instances and arrays is allocated )
➢我要说的是:“几乎”所有的对象实例都在这里分配内存。 从实际使用角度看的。
● 数组和对象可能永远不会存储在栈上,因为栈帧中保存引用,这个引用指向对象或者数组在堆中的位置。
● 在方法结束后,堆中的对象不会马上被移除,仅仅在垃圾收集的时候才会被移除。
● 堆,是GC ( Garbage Collection, 垃圾收集器)执行垃圾回收的重点区域。
堆内存细分:
设置堆空间大小
● Java堆区用于存储Java对象实例,那么堆的大小在JVM启动时就已经设定好了,大家可以通过选项”-Xmx"和”-Xms"来进行设置。
➢“-Xms" 用于表示堆区的起始内存 -X是jvm的运行参数 memory start简写,等价于-XX: InitialHeapSize -Xms用来设置堆空间(年轻代+老年代)的初始内存大小
➢“-Xmx" 则用于表示堆区的最大内存,等价于-XX :MaxHeapSize -Xmx用来设置堆空间(年轻代+老年代)的最大内存大小
● 一旦堆区中的内存大小超过“-Xmx"所指定的最大内存时,将会抛出OutOfMemoryError异常。
● 通常会将-Xms和-Xmx两个参数配置相同的值,其目的是为了能够在java垃圾回收机制清理完堆区后不需要重新分隔计算堆区的大小,从而提高性能。
● 默认情况下,初始内存大小:物理电脑内存大小/ 64
最大内存大小:物理电脑内存大小/ 4
手动设置: - Xms600m - Xmx600m
开发中建议将初始堆内存和最大的堆内存设置成相同的值。
查看设置的参数:
方式一: jps / jstat -gc 进程id
方式二: -XX: +PrintGCDetails

OOM举例
创建Picture对象,放在ArrayList数组内,因为不论是对象还是数组都会放在空间中,设置堆最大空间和初始空间 -Xms600 -Xmx600
package JUC;
import java.util.*;
public class ttt {
public static void main(String[] args) {
ArrayList<Picture> list = new ArrayList<>();
while (true){
try {
Thread.sleep(20);
}catch (InterruptedException e){
e.printStackTrace();
}
list.add(new Picture(new Random().nextInt(1024*1024)));
}
}
}
class Picture{
private byte[] pixels;
public Picture(int length){
this.pixels = new byte[length];
}
}Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at JUC.Picture.<init>(ttt.java:31)
at JUC.ttt.main(ttt.java:17)

年轻代和老年代
● 存储在JVM中的Java对象可以被划分为两类:
➢一类是生命周期较短的瞬时对象,这类对象的创建和消亡都非常迅速
➢另外一类对象的生命周期却非常长,在某些极端的情况下还能够与JVM的生命周期保持一致。
● Java堆区进一步细分的话, 可以划分为年轻代(YoungGen)和老年代(OldGen)
● 其中年轻代又可以划分为Eden空间、Survivor0空间和Survivor1空间(有时也叫做from区、to区)。

● 配置新生代与老年代在堆结构的占比。
➢默认-XX:NewRatio=2,表示新生代占1,老年代占2,新生代占整个堆的1/3
➢可以修改-XX:NewRatio=4,表示新生代占1,老年代占4,新生代占整个堆的1/5

- Xms 600m -Xmx600m
-XX: SurvivorRatio : 设置新生代中Eden区与survivor区的比例
-XX: -UseAdaptiveSizePolicy :关闭自适应的内存分配策略( 暂时用不到)
● 在HotSpot中, Eden空间和另外两个Survivor空间缺省所占的比例是8:1:1
● 当然开发人员可以通过选项“-XX:SurvivorRatio"调整这个空间比例。比如-XX: SurvivorRatio=8
● 几乎所有的Java对象都是在Eden区被new出来的。
● 绝大部分的Java对象的销毁都在新生代进行了。
➢IBM公司的专门研究表明,新生代中80号的对象都是“朝生夕死”的。
● 可以使用选项"-Xmn"设置新生代最大内存大小
➢这个参数-般使用默认值就可以了。

图解对象分配一般过程
为新对象分配内存是一件非常严谨和复杂的任务,JVM的设计者们不仅需要考虑内存如何分配、在哪里分配等问题,并且由于内存分配算法与内存回收算法密切相关,所以还需要考虑GC执行完内存回收后是否会在内存空间中产生内存碎片。
1. new的对象先放伊甸园区。此区有大小限制。
2.当伊甸园的空间填满时,程序又需要创建对象,JVM的垃圾回收器将对伊甸园区进行垃圾回收(Minor GC), 将伊甸园区中的不再被其他对象所引用的对象进行销毁。再加载新的对象放到伊甸园区
3.然后将伊甸园中的剩余对象移动到幸存者0区。
4.如果再次触发垃圾回收,此时上次幸存下来的放到幸存者0区的,如果没有回收,就会放到幸存者1区。
5.如果再次经历垃圾回收,此时会重新放回幸存者0区,接着再去幸存者1区。
6.啥时候能去养老区呢?可以设置次数。默认是15次。最大15
可以设置参数: -XX : MaxTenuringThreshold=<N>进行设置。
7.在养老区,相对悠闲。当养老区内存不足时,再次触发GC: Major GC,进行养老区的内存清理。
8.若养老区执行了Major GC之后发现依然无法进行对象的保存,就会产生00M异常
java. lang . OutOfMemoryError: Java heap space



思路图

方法区
运行时数据区结构图

栈、堆、方法区的交互关系

