首先前面的 \ 表示转义,
- \x:只是 16 进制的意思,后边跟两位,则表示单字节编码;
- \d:十进制;\o:八进制;
- 对于 \xaa ⇒ chr(0xaa) ⇒ chr(16*a+a)
>> str1='\xE4\xB8\x89\xE7\xBA\xA7\xE8\x8A\x82\xE7\x82\xB9' >> print unicode(str1,'utf-8') |
- \u:unicode 码;
- 一般其后跟 4 个 16 进制数,因此,一般为 unicode-16
- Python:字符串的decode和encode成员函数,可对其进行转换
>> str2 = '\u4f60\u597d' >> print str2.decode( 'unicode_escape' ) # 一定要使用 print |