一篇文章助你理解Python2中字符串编码问题-创新互联-乐山大橙子建站

新闻中心

这里有您想知道的互联网营销解决方案

一篇文章助你理解Python2中字符串编码问题-创新互联

前几天给大家介绍了unicode编码和utf-8编码的理论知识，没来得及上车的小伙伴们可以戳这篇文章：浅谈unicode编码和utf-8编码的关系。下面在Python2环境中进行代码演示，分别Windows和Linux操作系统下进行演示，以加深对字符串编码的理解。

创新互联建站为客户提供专业的做网站、成都网站建设、程序、域名、空间一条龙服务，提供基于WEB的系统开发. 服务项目涵盖了网页设计、网站程序开发、WEB系统开发、微信二次开发、移动网站建设等网站方面业务。

一篇文章助你理解Python2中字符串编码问题

1、首先在Windows操作系统下的Python2环境中进行演示，我们都知道Python2中的编码问题经常出现，需要通过编码（encode）和解码（decode）进行实现。通过cmd进入命令行窗口，然后输入两个字符串’abc’和u’abc’，如下图所示。需要注意的是这两个字符串的编码格式是不一样的，前者是string，后者是unicode。接下来对其进行编码，指定编码为utf-8，可以发现两个都正常显示，没有报错。

一篇文章助你理解Python2中字符串编码问题

当字符串变为中文的时候，尔后对其再次进行编码演示的时候，如下图所示，可以看到前者有报错产生，而后者没有报错。这个报错在Python2中经常出现，所以需要特别注意，Python字符串在内存中它是通过unicode来进行编码的。此时定义的str1它传递过来的是utf-8编码，非unicode编码，使用encode()函数的前提是待转换的字符串编码为unicode编码。所以可以看到str1会报错，而str2并没有报错。在Windows下字符串的编码格式是GB2312编码，在Linux下字符串的编码格式是utf-8编码。如果想要将str1顺利的转换为utf-8编码的话，则需要先将str1进行解码成unicode编码，再进行编码即可，此时得到的结果同str2转换的结果是一致的。

一篇文章助你理解Python2中字符串编码问题

2、现在在Linux操作系统下的Python2环境中进行演示，使用一样的字符串，结果最后是一样的，但是过程有些不同，如下图所示。

一篇文章助你理解Python2中字符串编码问题

在Windows下字符串的编码格式是GB2312编码，在Linux下字符串的编码格式是utf-8编码。所以当输入有中文的字符串的时候，直接编码为utf-8会报错；通过gb2312编码进行解码也会报错。只要通过utf-8编码进行解码，然后再通过utf-8进行编码才可以正确的输出结果。
有个地方大家可能会觉得很奇怪，就是一开始str1.encode(‘utf-8’)，表面上看上去str1已经是unicode编码了，之后进行编码，按说没有什么问题，可是为什么还是会报错呢？其实主要原因还是在于str1并不是真正的解码成了unicode格式。其实str1.encode(‘utf-8’)，它默认的会进行一步解码，但是其decode()的过程调用的是默认的编码格式，而这个默认的编码格式却是ASCII编码，如下图所示。

一篇文章助你理解Python2中字符串编码问题

当中文字符串使用ASCII编码进行解码之后，本身就报错了，后边的encode(‘utf-8’)根本就没有执行到。
关于Python2中字符串编码的问题，就先介绍到这里了，相信大家应该有了一个初步的认识了，下一篇文章将介绍Python3中字符串编码的问题。

另外有需要云服务器可以了解下创新互联scvps.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

标题名称：一篇文章助你理解Python2中字符串编码问题-创新互联
链接URL：http://lswzjz.com/article/ijjsg.html

新闻中心

其他资讯