java虚拟机在class文件中对应类型的常量池中使用了一种类似utf8格式的变体来存储一个常量字符串。
(这里请不要和java se的string api搞混淆,这里谈的是class文件的文件格式问题,我这里只是感觉这种方式比较节省空间,故拿出来请大家看一下。)
utf-8编码模式允许字符串中的所有unicode字符以2个字节的形式表示,而ascii码(空字符null除外)以一个字节表示。
从’\u0001’到’、’\u007f’的所有字符都使用一个字节表示。
字节0: 0 6543210
空字符null(‘\u0000’)和从’\u0080’到’\u07ff’的所有字符使用两个字节表示。
字节0:1 1 1 10 9 8 7 6
字节1:1 0 5 4 3 2 1 0
从’\u0800’到’\uffff’的所有字符使用3个字节表示。
字节0:1 1 1 15 14 13 12
字节1:1 0 11 10 9 8 7 6
字节2:1 0 5 4 3 2 1 0