python – 将变量类型转换为unicode字符串

我正在寻找一种方法将变量(可能是一个ASCII字符串,unicode字符串与额外字符,如é或£,或浮点数或整数)转换为unicode字符串.

variable.encode(‘utf-8′)其中variable是一个整数导致AttributeError:’int’对象没有属性’encode’

str(变量).encode(‘utf-8’)其中变量是字符串’£’导致UnicodeDecodeError:’ascii’编解码器无法解码位置0中的字节0xc2:序数不在范围内(128)

有没有一种简单的方法来完成我在Python 2.7中寻找的东西?或者我是否必须检查变量的类型并以不同的方式处理它?

最佳答案 编码永远不会导致unicode对象.您从字节解码到unicode.

因此,您将转换为str(字节字符串),然后通过解码转换为unicode:

str(obj).decode('utf8')

对于已经是unicode值的对象,这仍然会失败,因此您可能希望使用try..except来捕获该情况:

try:
    obj = str(obj).decode('utf8')
except UnicodeEncodeError:
    # already unicode
    pass

如果您尝试对字节字符串进行编码,Python 2会先隐式地为您解码为unicode,这就是您获得UnicodeDecodeError的原因.

点赞