ASCII码:只有英文和拉丁字符,一个字符占一个字节,8位
gb2312:只有6700个中文 1980年
gbk10:存了2万多个中文 1995年
gb18030:27000中文 2000年
utf-32:一个字符占4个字节
utf-16:一个字符占2个字节或2个字节以上
utf-8:英文用ASCII码存,一个中文占3个字节
gbk到unicode称为编码decode() 会把byte类型转成字符串
unicode到gbk称为解码encode() 会把数据转换成byte类型
打开文件
f = open(文件位置,模式)
’r’ 读模式:只能读不能写。
’w’ 写模式:只能写不能读,且会将原先内容清除
’a’ 追加模式:只能写不能读,不会将原先内容清除
f.close() 关闭文件,操作完文件一点要关闭文件
f.write() 参数为内容,将内容写入文件
f.read() 默认读取全文,参数为读取几个字符
f.redline() 默认读取第一行,光标会移动到第一行最后,所以再用readline()会读取第二行
f.readlines() 默认读取全文,且返回一个列表
for i in f:
print(f) for内部将f对象做成一个迭代器,在内存中用一行去一行
f.tell() 查看光标位置,一个中文3个字符,一个英文一个字符
f.seek() 调整光标位置,参数为位置。