python的XML解析

折腾了好几个小时,终于明白了两点:

1.UTF-8格式的汉字和gb2312的汉字是不同的.
2.utf-8的汉字在终端上显示是乱码.(我还以为是解析的结果不对.没想到是print到终端上,终端的显示有问题.)
3.虽然资源占用大一些,建议使用utf-8, 并在python源程序中加上:
     # -*- coding: utf-8 -*-
4.对于不支持utf-8编码的软件,要将文本文件用notepad打开,并另存为utf-8格式

   Dive Into Python

 阮一峰: 字符编码笔记:ASCII,Unicode和UTF-8


--
颂祺 / Cordialement / With kind regards / Viele Gruesse / Met vriendelijke groet

Lancelot MAY

Leave a Reply

Your email address will not be published. Required fields are marked *