Python struct(字节流,组包拆包实现)模块详解

看到struct这么英文单词,大家应该并不陌生,因为c/c++中就有struct,在那里struct叫做结构体。在Python中也使用struct,这充分说明了这个struct应该和c/c++中的struct有很深的渊源。Python正是使用struct模块执行Python值和C结构体之间的转换,从而形成Python字节对象。它使用格式字符串作为底层C结构体的紧凑描述,进而根据这个格式字符串转换成Python值。

我们知道python只定义了6种数据类型,字符串,整数,浮点数,列表,元组,字典。但是C语言中有些字节型的变量,在python中该如何实现呢?这点颇为重要,特别是要在网络上进行数据传输的话。

python提供了一个struct模块来提供转换。下面就介绍这个模块中的几个方法。

pack(fmt, v1, v2, …)  —— 根据所给的fmt描述的格式将值v1,v2,…转换为一个字符串。

unpack(fmt, bytes)    —— 根据所给的fmt描述的格式将bytes反向解析出来,返回一个元组。

calcsize(fmt)             —— 根据所给的fmt描述的格式返回该结构的大小。

struct.pack():

struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, …),参数fmt是格式字符串,关于格式字符串的相关信息下面有所介绍。v1, v2, …表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):

>>> import struct

>>> a=20

>>> b=400

>>> str=struct.pack(‘ii’,a,b)    #转换成字节流,虽然还是字符串,但是可以在网络上传输

>>> print len(str)               #ii 表示两个int

8                                #可以看到长度为8个字节,正好是两个int型数据的长度

>>> print str

                               #二进制是乱码

>>> print repr(str)

‘\x14\x00\x00\x00\x90\x01\x00\x00’   #其中十六进制的 0x00000014, 0x00001009分别表示20和400

>>>

   由此我们就可以任意的进行组包了,比如下面一个打包的例子,只介绍其中的pack

 

format = “!HH%ds” % len(data)

buffer = struct.pack(format,opcode,blocknumber,data)

  我们要对一个数据进行打包,加上一些个包头,我们根据下面的格式符信息,知道H是unsigned short是2个字节,而s是char型。所以这个buffer就是2个字节的opcode,2个字节的blocknumber,和len长的char。

 

Python模块——struct(字节流,组包拆包实现)

   struct.unpack():

   我们接着上面的例子运行:

>>> a1,a2=struct.unpack(‘ii’,str)

>>> print ‘a1’,a1

a1 20

>>> print ‘a2=’,a2

a2= 400

可以看到 “ii”以四个字节为分界,把8个字节的str分成了两个int型的整数。

 struct.calcsize():用来计算特定格式的输出的大小,是几个字节,比如:

>>> struct.calcsize(‘HH4s’)

8

>>> struct.calcsize(‘ii’)

8

>>>

>>> format=’!HH%ds’ % len(‘hello python’)

>>> struct.calcsize(format)

16

>>>

点赞