关于 int 和 Integer 不得不说的事

2023年11月26日 195次阅读来源: wean_a23e

任何一个学过 Java 的人，肯定知道 int 是原始数据类型，Integer 是一个对象，他们之间可以自动地拆箱装箱。但，如果继续挖掘，仍然大有分析地余地。你，真的懂 int 和 Integer 了吗？

关于自动拆箱和装箱

我们都知道 int 和 Integer 可以自动相互转换，这是 Java 给我们提供的一种语法糖，但是，它是“怎么”转换的？在什么时候转换？是编译期还是运行期？

眼见为实，让我们编写一段代码来实际看看过程

public class TestClass {
    
    public void inc () {
        Integer integer = 1;
        int unboxing = integer ++;
    }
}

这是一段普通的代码，但它完整包含了三个动作：将一个原始数据类型转换成包装类型、将一个包装类型转换成一个原始数据类型、对一个包装类型进行直接的运算。

接下来通过 javap -verbose 指令解析编译后的 class 文件，以下是在我的电脑上的 JDK 1.8 版本解析的结果，看看编译过程发生了什么事

 public void inc();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=5, args_size=1
         0: iconst_1
         1: invokestatic  #2                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
         4: astore_1
         5: aload_1
         6: astore_3
         7: aload_1
         8: invokevirtual #3                  // Method java/lang/Integer.intValue:()I
        11: iconst_1
        12: iadd
        13: invokestatic  #2                  // Method java/lang/Integer.valueOf:(I)Ljava/lang/Integer;
        16: dup
        17: astore_1
        18: astore        4
        20: aload_3
        21: invokevirtual #3                  // Method java/lang/Integer.intValue:()I
        24: istore_2
        25: return

这是节选自 inc() 方法的一段字节码，查看它的操作指令及注释，可以得出结论

自动拆箱装箱是在编译期完成的
javac 将装箱操作用 Integer.valueOf() 代替了，将拆箱用 Integer.intValue() 代替了
包装对象的运算，要先拆箱成原始数据类型，进行运算完毕后再装箱

通过对这个反编译例子的研究，我们就明白，在以后编程中，需要进行大量计算的地方，应该使用原始数据类型，在性能敏感的场合，优先使用原始数据类型。

关于 Integer 源码

整体看一下 Integer 类的源码，可以发现这个类主要是由几个常量，两个装箱拆箱方法，一些进制转换方法，一些位操作方法组成。

其中有几个比较有意思的点，

类和常量都被 final 修饰了起来。

很容易由此联想到这是一个不可变类 (immutable），由此想到不可变类的设计原则：

类标识打上 final 标志
类变量使用 final 修饰
提供构造或者工厂方法设置类变量的初始值，不提供 set 方法
构造时，对引用类型使用深拷贝，避免外部不确定因素的影响
将集合改为不可变集合，比如使用 Java 9 List.of() 方法

特别的常量

Integer 类除了提供最大、最小的常数外，还提供了位数和字节数的两个常量。后面这两个常量，值得提一下。

如果我们写过 c 或者 c++ 语言，就会知道，在这两种语言中， int 类型在 32 位和 64 位系统中是不确定的。而在 Java 中，我们无需担忧这种不同，因为在 Java 语言规范中明确规定了各种基本类型的长度。

https://docs.oracle.com/javase/specs/jls/se10/html/jls-4.html#jls-4.2

这也是 Java 实现它的承诺——一次书写，到处运行，的一个细节。

关于缓存

我们都知道 Java 自动缓存了一个小范围的整数值。并且都在无数的地方中看到了别人对这个范围的描述—— -128~127。但，如果读过了 Integer 的源码，你就会发现这是错误的说法。

        static final int low = -128;
        static final int high;
        static final Integer cache[];

        static {
            // high value may be configured by property
            int h = 127;
            String integerCacheHighPropValue =
                sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
            if (integerCacheHighPropValue != null) {
                try {
                    int i = parseInt(integerCacheHighPropValue);
                    i = Math.max(i, 127);
                    // Maximum array size is Integer.MAX_VALUE
                    h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
                } catch( NumberFormatException nfe) {
                    // If the property cannot be parsed into an int, ignore it.
                }
            }
            high = h;

            cache = new Integer[(high - low) + 1];
            int j = low;
            for(int k = 0; k < cache.length; k++)
                cache[k] = new Integer(j++);

            // range [-128, 127] must be interned (JLS7 5.1.7)
            assert IntegerCache.high >= 127;
        }

在生成缓存的这段代码中，我们注意到了一个细节，范围的下限确实是 -128，但上限是可以调节的。
如果我们的程序需要更大的缓存范围，我们可以通过在启动 JVM 时增加参数-XX:AutoBoxCacheMax=N，来设置这个缓存范围的上限。

对于缓存，还可以同样观察下其他基本类型的包装类，都同样做了一个小范围的缓存。

关于占用空间

如果我们要创建 10 万个整数，那么光是对象头的占用空间，Integer 就要比 int 多出一个数量级。这是对象机制不可避免带来的问题，我们在编写操作大量数据的代码时，也应该考虑占用空间的问题。

关于线程安全

我们都知道，不可变类是实现线程安全共享对象的一种方式。但是原始元素类型的运算就不是线程安全的。如果多个线程同时对一个 int 对象做运算，就可能引发并发问题。

如果有线程安全计算的需要，可以使用 AtomicInteger 这样的线程安全类进行计算。

但，如果不想涉及到类，想直接在原始数据类型上做并发操作，也是有办法的。Java 提供了 AtomicIntegerFieldUpdater 这样的类进行 cas 安全操作。下面是使用原始数据类型实现一个计数器的方式。

 class CompactCounter {
    private volatile long counter;
    private static final AtomicLongFieldUpdater<CompactCounter> updater = AtomicLongFieldUpdater.newUpdater(CompactCounter.class, "counter");
    public void increase() {
        updater.incrementAndGet(this);
    }
}

关于局限性

Java 走过了这么多年的历程，这种类型系统的设计已经是很久前的了，现在也逐渐暴露了一些缺点。

原始数据类型不能和泛型完美配合。

Java 的泛型机制，是一种伪泛型，它在编译期将类型转换为特定的类型。这就要求相应类型可以转换为 Object。

无法高效地表达数据

如果我们写过 python、scala。就会知道，这些语言中有 vector、tuple。极大地方便了我们编程，简洁了代码。

但是由于 Java 语言的实现机制，在对象数组中存放的是对象的引用，实际对象分散在堆内存的各个地方。这种方式虽然带来了极大的灵活性，但是却带来了数据操作的低效。

    原文作者：wean_a23e
    原文地址: https://www.jianshu.com/p/fa105422362e
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。