Java byte[]转换成String 数据不一致

2023年4月29日 287次阅读来源: Do_40

当需要将byte[]转换成String字符串后再次将字符串转成byte[]时，发现用String的getBytes()的方法得到的byte[]跟原来的byte[]是不一样的。

看如下代码：

byte[] bytes = new byte[] { 50, 0, -1, 28, -24 };
String string = new String(bytes);
byte[] res = string.getBytes();

查看res的数据发现是 [50, 0, -17, -65, -67, 28] 并不是原来的数据。

而使用如下代码就可以得到原来的数据：

byte[] bytes = new byte[] { 50, 0, -1, 28, -24 };
String isoString = new String(bytes, “ISO-8859-1”);
byte[] isores = isoString.getBytes(“ISO-8859-1”);

这是为什么呢？原因是第一种方法默认是用UTF-8编码来生成String的。UTF-8是可变长度的编码，原来的字节数组就被改变了。而ISO-8859-1通常叫做Latin-1，Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符，其中 0~127的字符与ASCII码相同，它是单字节的编码方式，这样第二种方式生成的String里的字节数组就跟原来的字节数组一样。在new String使用其他编码如GBK,GB2312的话一样也会导致字节数组发生变化，因此要想获取String里单字节数组，就应该使用ISO-8859-1编码。

    原文作者：Do_40
    原文地址: https://www.jianshu.com/p/9e31d0522643
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。