项目场景:
CSV文件可以使用Excel、notepad等编辑器进行编辑,由于笔者部门业务涉及国际语言,Excel 2016默认处理CSV后编码格式会修改为ANSI,导致原本指定了使用UTF-8编码解析CSV文件时出现乱码问题(由于业务需求不能使用ANSI等编码格式)。
问题描述:
生成一个UTF-8编码的CSV文件模板
使用文本编辑器打开查看编码为UTF-8
用Excel打开并编辑后再次查看编码格式
文本内容以及不再使用逗号分隔,以及编码格式变为了ANSI
原因分析:
经过测试,Excel在处理.xlsx格式的文件时会按照原编码保存文件,但是处理CSV文件时会保存为ANSI格式的文本文件。
解决方案:
首先使用Excel处理完CSV文件时不要直接保存,需要通过另存为的功能选择输出的文件格式,选中文件类型为CSV(按逗号分隔)
保存后再次用文本编辑器打开,发现编码仍然为ANSI(即使在另存为时指定了编码为UTF-8)
此时使用文本编辑器再次另存为UTF-8格式
此时可以解决问题(在需要使用UTF-8编码格式处理CSV文件时,如果不需要的话建议尝试使用ANSI编码格式处理)