首页  

java class类文件结构     所属分类 jvm 浏览量 821
任何一个Class文件都对应着唯一的一个类或接口的定义信息,
但是反过来说,类或接口并不一定都得定义在文件里(譬如类或接口也可以动态生成,直接送入类加载器中)。


根据《Java虚拟机规范》的规定,
Class文件格式采用一种类似于C语言结构体的伪结构来存储数据,
这种伪结构中只有两种数据类型:“无符号数”和“表”。


无符号数可以用来描述数字、索引引用、数量值或者按照UTF-8编码构成字符串值。

表是由多个无符号数或者其他表作为数据项构成的复合数据类型,
为了便于区分,所有表的命名都习惯性地以“_info”结尾。


字节码由10部分组成,
依次是魔数、版本号、常量池、访问权限、类索引、父类索引、接口索引、字段表索引、方法、Attribute

魔数  每个Class文件的头4个字节被称为魔数(Magic Number),
它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件

1个十六进制数对应 4 位 二进制数,那么CAFEBABE 一共 8 个十六进制数,
一共需要 32 位二进制数,对应就是 4 个字节

版本号  由minor_version(次版本号)major_version(主版本号) 组成各占两个字节

常量池  Class文件结构中与其他项目关联最多的数据,
通常也是占用Class文件空间最大的数据项目之一,
另外,它还是在Class文件中第一个出现的表类型数据项目


常量池中主要存放两大类常量:字面量(Literal)和符号引用(Symbolic References)
字面量比较接近于Java语言层面的常量概念,如文本字符串、被声明为final的常量值等。

而符号引用则属于编译原理方面的概念,主要包括下面几类常量:

被模块导出或者开放的包(Package)
类和接口的全限定名(Fully Qualified Name)
字段的名称和描述符(Descriptor)
方法的名称和描述符
方法句柄和方法类型(Method Handle、Method Type、Invoke Dynamic)
动态调用点和动态常量(Dynamically-Computed Call Site、Dynamically-ComputedConstant)
访问标识  
紧接着的2个字节代表访问标志(access_flags),
这个标志用于识别一些类或者接口层次的访问信息,
包括:
这个Class是类还是接口;是否定义为public类型;
是否定义为abstract类型;
如果是类的话,是否被声明为final 等


类索引(this_class)和父类索引(super_class)都是一个u2类型的数据,
而接口索引集合(interfaces)是一组u2类型的数据的集合,
Class文件中由这三项数据来确定该类型的继承关系

字段表(field_info)用于描述接口或者类中声明的变量
Java语言中的“字段”(Field)包括类级变量以及实例级变量,
但不包括在方法内部声明的局部变量。
字段可以包括的修饰符有字段的作用域(public、private、protected修饰符)
是实例变量还是类变量(static修饰符)
可变性(final)
并发可见性(volatile修饰符,是否强制从主内存读写)
可否被序列化(transient修饰符)
字段数据类型(基本类型、对象、数组)
字段名称


描述符的作用是用来描述字段的数据类型、方法的参数列表(包括数量、类型以及顺序)和返回值。
根据描述符规则,基本数据类型(byte、char、double、float、int、long、short、boolean)
以及代表无返回值的void类型都用一个大写字符来表示,而对象类型则用字符L加对象的全限定名来表示


对于数组类型,每一维度将使用一个前置的“[”字符来描述
如一个定义为 java.lang.String[][] 二维数组 记录成  [[Ljava/lang/String
一个整型数组 int[] 记录成 [I

用描述符来描述方法时,按照先参数列表、后返回值的顺序描述,
参数列表按照参数的严格顺序放在一组小括号“()”之内
如方法void inc()的描述符为“()V”,
方法java.lang.String toString()的描述符为  ()Ljava/lang/String 
方法int indexOf(char[]source,intsourceOffset,int sourceCount,char[]target,int targetOffset,int targetCount,intfromIndex)的描述符为
([CII[CIII)I


方法表集合  
方法里的Java代码,经过Javac编译器编译成字节码指令之后,
存放在方法属性表集合中一个名为“Code”的属性里面
属性表作为Class文件格式中最具扩展性的一种数据项目。

有可能会出现由编译器自动添加的方法,最常见的便是类构造器
< clinit>() 方法和实例构造器 < init>() 方法

 
属性表(attribute_info)
Class文件、字段表、方法表都可以携带自己的属性表集合,以描述某些场景专有的信息
《Java虚拟机规范》允许只要不与已有属性名重复
编译器可以向属性表中写入自己定义的属性信息
Java虚拟机运行时会忽略掉它不认识的属性

上一篇     下一篇
专利受理和授权及奖金

三分钟学会杜邦分析

ROE简介

JVM字节码指令

JVM类加载过程

JVM类加载器