折腾了好几个小时,终于明白了两点:
1.UTF-8格式的汉字和gb2312的汉字是不同的.
2.utf-8的汉字在终端上显示是乱码.(我还以为是解析的结果不对.没想到是print到终端上,终端的显示有问题.)
3.虽然资源占用大一些,建议使用utf-8, 并在python源程序中加上:
# -*- coding: utf-8 -*-
4.对于不支持utf-8编码的软件,要将文本文件用notepad打开,并另存为utf-8格式
2.utf-8的汉字在终端上显示是乱码.(我还以为是解析的结果不对.没想到是print到终端上,终端的显示有问题.)
3.虽然资源占用大一些,建议使用utf-8, 并在python源程序中加上:
# -*- coding: utf-8 -*-
4.对于不支持utf-8编码的软件,要将文本文件用notepad打开,并另存为utf-8格式
Dive Into Python
阮一峰: 字符编码笔记:ASCII,Unicode和UTF-8
--
颂祺 / Cordialement / With kind regards / Viele Gruesse / Met vriendelijke groet
Lancelot MAY