12种Java中常用的语法糖
什么是语法糖
语法糖(Syntactic Sugar),也称糖衣语法,指在计算机语言中添加的某种语法,这种语法对语言的功能并没有影响,但是更方便程序员使用。简而言之,语法糖让程序更加简洁,有更高的可读性。
解语法糖
前面提到过,语法糖的存在主要是方便开发人员使用。但其实,Java虚拟机并不支持这些语法糖。这些语法糖在编译阶段就会被还原成简单的基础语法结构,这个过程就是解语法糖。说到编译,大家肯定都知道,Java语言中,javac命令可以将后缀名为.java的源文件编译为后缀名为.class的可以运行于Java虚拟机的字节码。如果你去看com.sun.tools.javac.main.JavaCompiler的源码,你会发现在compile()中有一个步骤就是调用desugar(),这个方法就是负责解语法糖的实现的。Java 中最常用的语法糖主要有泛型、变长参数、条件编译、自动拆装箱、内部类等。
糖块一: switch 支持 String 与枚举
从Java 7 开始,switch 开始支持 String。其实Java中的switch自身原本就支持基本类型。比如int、char等。对于int类型,直接进行数值的比较。对于char类型则是比较其 ascii 码。
所以,对于编译器来说,switch中其实只能使用整型,任何类型的比较都要转换成整型。比如byte。short,char(ascii码是整型)以及int。
那么接下来看下 switch 对 String 的支持,有以下代码:
1 | public class SwitchTest { |
反编译后的内容如下:
1 | public class SwitchTest { |
可以发现字符串的switch是通过equals()和hashCode()方法来实现的,hashCode()方法返回的是int,而不是long。
进行switch的实际是哈希值,然后通过使用equals方法比较进行安全检查,这个检查是必要的,因为哈希可能会发生碰撞。
糖块二: 泛型
很多语言都是支持泛型的,但不同的编译器对于泛型的处理方式是不同的。
通常情况下,一个编译器处理泛型有两种方式:Code specialization和Code sharing。
C++和C#是使用Code specialization的处理机制,而Java使用的是Code sharing的机制。
Code sharing方式为每个泛型类型创建唯一的字节码表示,并且将该泛型类型的实例都映射到这个唯一的字节码表示上。将多种泛型类形实例映射到唯一的字节码表示是通过类型擦除(type erasue)实现的。
也就是说,对于Java虚拟机来说,它根本不认识 Map<String, String> map 这样的语法。需要在编译阶段通过类型擦除的方式进行解语法糖。
类型擦除的主要过程如下:
将所有的泛型参数用其最左边界(最顶级的父类型)类型替换。
移除所有的类型参数。
例如:
1
2
3
4Map<String, String> map = new HashMap<String, String>();
map.put("111", "222");
map.put("333", "444");
map.put("555", "666");解语法糖后:
1
2
3
4Map map = new HashMap();
map.put("111", "222");
map.put("333", "444");
map.put("555", "666");
虚拟机中没有泛型,只有普通类和普通方法,所有泛型类的类型参数在编译时都会被擦除,并没有自己独有的 Class 类对象。比如并不存在 List<String>.class 或是List<Integer>.class,而只有 List.class。
补充:
- 当泛型遇到重载
1 | public class GenericTypes { |
上面这段代码,有两个重载的函数,因为他们的参数类型不同,但是,这段代码是编译不通过的。因为参数 List 和 List 编译之后都被擦除了,变成了一样的原生类型 List,擦除动作导致这两个方法的特征签名变得一模一样。
- 当泛型遇到catch
泛型的类型参数不能用在 Java 异常处理的 catch 语句中。因为异常处理是由JVM在运行时刻来进行的。由于类型信息被擦除,JVM是无法区分两个异常类型 MyException<String> 和 MyException<Integer> 的。
- 当泛型内包含静态变量
1 | public class StaticTest { |
以上代码输出结果为:2 !!! 由于经过类型擦除,所有的泛型类实例都关联到同一份字节码上,泛型类的所有静态变量是共享的。
糖块三: 自动装箱与拆箱
自动装箱就是Java自动将原始类型值转换成对应的对象,比如将int的变量转换成Integer对象,这个过程叫做装箱,反之将Integer对象转换成int类型值,这个过程叫做拆箱。
因为这里的装箱和拆箱是自动进行的非人为转换,所以就称作为自动装箱和拆箱。
原始类型byte, short, char, int, long, float, double 和 boolean 对应的封装类为Byte, Short, Character, Integer, Long, Float, Double, Boolean。
先来看个自动装箱的代码:
1 | public static void main(String[] args) { |
反编译后代码如下:
1 | public static void main(String args[]) |
再来看个自动拆箱的代码:
1 | public static void main(String[] args) { |
反编译后代码如下:
1 | public static void main(String args[]) |
从反编译得到内容可以看出,装箱过程是通过调用包装器的valueOf方法实现的,而拆箱过程是通过调用包装器的 xxxValue方法实现的。
补充:
自动装箱与拆箱——对象相等比较:
1 | public static void main(String[] args) { |
在Java 5中,在Integer的操作上引入了一个新功能来节省内存和提高性能。整型对象通过使用相同的对象引用实现了缓存和重用。适用于整数值区间-128 至 +127。只适用于自动装箱。使用构造函数创建对象不适用。数据会被自动装箱成包装类,JVM在比较之前会看在不在常量池范围内,在就字面量比较,不在就比较地址值。
糖块四: 方法变长参数
可变参数(variable arguments)是在Java 1.5中引入的一个特性。它允许一个方法把任意数量的值作为参数。
看下以下可变参数代码,其中print方法接收可变参数:
1 | public static void main(String[] args) |
反编译后得到:
1 | public static void main(String args[]) |
从反编译后代码可以看出,可变参数在被使用的时候,他首先会创建一个数组,数组的长度就是调用该方法是传递的实参的个数,然后再把参数值全部放到这个数组当中,然后再把这个数组作为参数传递到被调用的方法中。
糖块五: 枚举
Java SE5 提供了一种新的类型 — Java的枚举类型,关键字enum可以将一组具名的值的有限集合创建为一种新的类型,而这些具名的值可以作为常规的程序组件使用,这是一种非常有用的功能。enumn就和 class 一样,只是一个关键字,并不是一个类。
1 | public enum t { |
反编译后:
1 | public final class T extends Enum |
public final class T extends Enum 说明该类是继承了Enum类的,同时final关键字意味着这个类也是不能被继承的。
当我们使用enmu来定义一个枚举类型的时候,编译器会自动帮我们创建一个final类型的类继承Enum类,所以枚举类型不能被继承。
糖块六: 内部类
内部类又称为嵌套类,可以把内部类理解为外部类的一个普通成员。内部类之所以也是语法糖,是因为它仅仅是一个编译时的概念。
比如在 A.java 里面定义了一个内部类 B,一旦编译成功,就会生成两个完全不同的.class文件,分别是 A.class 和 A$B.class。所以内部类的名字完全可以和它的外部类名字相同。
一个类对应一个.class文件,多个类嵌套就会有多个.class文件。
糖块七:条件编译
一般情况下,程序中的每一行代码都要参加编译。但有时候出于对程序代码优化的考虑,希望只对其中一部分内容进行编译,此时就需要在程序中加上条件,让编译器只对满足条件的代码进行编译,将不满足条件的代码舍弃,这就是条件编译。
1 | public class ConditionalCompilation { |
反编译后代码如下:
1 | public class ConditionalCompilation { |
首先,我们发现,在反编译后的代码中没有 System.out.println(“Hello, ONLINE!”);,这其实就是条件编译。当 if(ONLINE) 为 false 的时候,编译器就没有对其内的代码进行编译。
所以,Java语法的条件编译,是通过判断条件为常量的 if 语句实现的。根据 if 判断条件的真假,编译器直接把分支为 false 的代码块消除。通过该方式实现的条件编译,必须在方法体内实现,而无法在正整个Java类的结构或者类的属性上进行条件编译。
糖块八: 断言
在Java中,assert关键字是从JAVA SE 1.4 引入的,为了避免和老版本的Java代码中使用了assert关键字导致错误,Java在执行的时候默认是不启动断言检查的(这个时候,所有的断言语句都将忽略!)。如果要开启断言检查,则需要用开关 -enableassertions 或 -ea来开启。
assert关键字语法很简单,有两种用法:
assert boolean表达式
如果为true,则程序继续执行。
如果为false,则程序抛出AssertionError,并终止执行。
assert boolean表达式 : 错误信息表达式
如果为true,则程序继续执行。
如果为false,则程序抛出java.lang.AssertionError,并输入\<错误信息表达式>。
例:1
2
3
4
5
6
7
8
9
10
11public class AssertFoo {
public static void main(String args[]) {
//断言1结果为true,则继续往下执行
assert true;
System.out.println("断言1没有问题,Go!");
System.out.println("\n-----------------\n");
//断言2结果为false,程序终止
assert false : "断言失败,此表达式的信息将会在抛出异常的时候输出!";
System.out.println("断言2没有问题,Go!");
}
}
开启-ea开关,执行程序:
1 | C:\>java -ea AssertFoo |
其实断言的底层实现就是 if 语言,如果断言结果为 true,则什么都不做,程序继续执行,如果断言结果为 false,则程序抛出 AssertionError 来打断程序的执行。
糖块十: for-each
1 | public class ForEachTest { |
反编译后代码如下:
1 | public class ForEachTest { |
for-each 的实现原理其实就是使用了普通的 for 循环和迭代器。
补充:
1 | for (Student stu : students) { |
会抛出ConcurrentModificationException异常。
Iterator是工作在一个独立的线程中,并且拥有一个 mutex 锁。 Iterator被创建之后会建立一个指向原来对象的单链索引表,当原来的对象数量发生变化时,这个索引表的内容不会同步改变,所以当索引指针往后移动的时候就找不到要迭代的对象,所以按照 fail-fast 原则 Iterator 会马上抛出 java.util.ConcurrentModificationException 异常。
所以 Iterator 在工作的时候是不允许被迭代的对象被改变的。但你可以使用 Iterator 本身的方法remove()来删除对象,Iterator.remove() 方法会在删除当前迭代对象的同时维护索引的一致性。
糖块十一: try-with-resource
Java里,对于文件操作IO流、数据库连接等开销非常昂贵的资源,用完之后必须及时通过close方法将其关闭,否则资源会一直处于打开状态,可能会导致内存泄露等问题。
关闭资源的常用方式就是在 finally 块里是释放,即调用 close 方法。比如,我们经常会写这样的代码:
1 | public static void main(String[] args) { |
从Java 7开始,jdk 提供了一种更好的方式关闭资源,使用 try-with-resources 语句,改写一下上面的代码,效果如下:
1 | public static void main(String... args) { |
其实背后的原理也很简单,那些我们没有做的关闭资源的操作,编译器都帮我们做了。
糖块十二: Lambda表达式
Labmda 表达式不是匿名内部类的语法糖,但是他也是一个语法糖。实现方式其实是依赖了几个 JVM 底层提供的 lambda 相关 api。
它并不是内部类的语法糖,前面讲内部类我们说过,内部类在编译之后会有对应的 class 文件,但是,包含 lambda 表达式的类编译后只有一个文件。