Java byte[]转换成String 数据不一致

当需要将byte[]转换成String字符串后再次将字符串转成byte[]时,发现用String的getBytes()的方法得到的byte[]跟原来的byte[]是不一样的。

看如下代码:

byte[] bytes = new byte[] { 50, 0, -1, 28, -24 };

String string = new String(bytes);

byte[] res = string.getBytes();

查看res的数据发现是 [50, 0, -17, -65, -67, 28] 并不是原来的数据。

而使用如下代码就可以得到原来的数据:

byte[] bytes = new byte[] { 50, 0, -1, 28, -24 };

String isoString = new String(bytes, “ISO-8859-1”);

byte[] isores = isoString.getBytes(“ISO-8859-1”);

这是为什么呢?原因是第一种方法默认是用UTF-8编码来生成String的。UTF-8是可变长度的编码,原来的字节数组就被改变了。而ISO-8859-1通常叫做Latin-1,Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符,其中 0~127的字符与ASCII码相同,它是单字节的编码方式,这样第二种方式生成的String里的字节数组就跟原来的字节数组一样。在new String使用其他编码如GBK,GB2312的话一样也会导致字节数组发生变化,因此要想获取String里单字节数组,就应该使用ISO-8859-1编码。

    原文作者:Do_40
    原文地址: https://www.jianshu.com/p/9e31d0522643
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞