背景
今天在爬虫抓取网页信息并写如为csv文件时,使用excel打开后,竟然中文部分都是乱码。
一般出现乱码问题都是文本编码不对的问题,修改成对应的编码即可。
操作系统:MAC
解决办法
方法一:
在windows环境下,可以只用使用notepad++或者系统自带的记事本打开,之后另外保存一份为ANSI编码格式,再使用excel打开即可。
在MAC下也可以安装对应的软件修改编码。
方法二:
上面的方法需要另外保存一份文档,而且mac上还得另外安装软件才行。研究了一下,其实excel是有自带的转换方法的。
操作如下:
首先打开excel并新建一个文档
在 数据 - 从文本 导入数据
在弹出来的导入向导中,我们就可以发现文本的原始格式有误了
将文本的原始格式选择为”Unicode(UTF-8)”之后,我们发现乱码变中文了
继续”下一步”,按照默认的”分号”分割或者自定义的其他分隔符分割
再”下一步”,按需选择后完成即可。
扩展
这次的csv文件是在进行网络爬虫抓取数据中遇到的,在浏览器中,现在基本上都是UTF-8格式的编码,所以这点还是要注意一下。