'gbk' codec can't encode character '

今天爬拉钩,在写入网页源码到html时,总是报UnicodeEncodeError: ‘gbk’ codec can’t encode character错误

出错的原因是网页及python的编码都是utf-8,在写入文件时Windows默认转码成gbk,遇到某些gbk不支持的字符就会报错。在打开文件时就声明编码方式为utf-8就能避免这个错误。

解决方法十分简单:

f = open('lagou.html', 'w',encoding='utf-8')

使用open()函数时一定不要忘了加上encoding='utf-8'参数

    原文作者:全栈coder
    原文地址: https://www.jianshu.com/p/5c391b605d27
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞