encode和decode

使用python编程,如果涉及到中文字符串,常常需要考虑字符串的encode和decode问题。


python里面使用u声明的字符串为unicode类型,eg: astring = u"你好,这是个测试用例", 使用type(astring)查看,其类型为unicode(直接显示字符对象,字符编码使用\u分隔);
通过bstring = astring.encode("utf-8")可以得到astring的str类型字符串(显示字符对象,字符编码使用\x分隔);
还可以使用cstring = astring.decode("utf-8")将它再次转会到unicode类型;

unicode     --encode-->        string
string     --uncode-->         unicode

是不是和你想象中的关系有点相反?

版权声明:本文为Byane原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。