Python 编码的这些坑，你还在踩吗！？

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

无邪的创口贴 · python-2.7 ...· 16 小时前 ·

大方的沙滩裤 · linux ...· 16 小时前 ·

礼貌的消炎药 · Activation fails all ...· 16 小时前 ·

耍酷的柳树 · Still cant upgrade to ...· 16 小时前 ·

瘦瘦的绿茶 · Python用PyQt5实现多种弹出消息框， ...· 14 小时前 ·

至今单身的风衣 · python怎么在屏幕上画图_mob64ca ...· 1 周前 ·

阳光的充值卡 · 喵喵早安（简体）(松小兔)-喵喵早安（简体） ...· 1 月前 ·

爱搭讪的蚂蚁 · 筑地市场前身——日本桥鱼河岸的诞生|关东|埼 ...· 1 月前 ·

高大的冰棍 · 视频｜泰迪熊有过世爸爸的香水味道 ...· 3 月前 ·

还单身的消炎药 · shell 编程 && bash ...· 8 月前 ·

Unicode: 把所有语言都统一到一套编码里把所有语言都统一到一套编码里，

一般是2个字节，生僻字4个字节

utf-8：可变长编码，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间：

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码，这样可以节省很多存储空间。

Python编码（python2.7）

在python中，str和unicode都是basestring的子类，basestring有以下两个方法：

encode()：将unicode字符串转换为其他编码字符串，参数为转换后编码

decode()：将其他编码转换为unicode字符串，参数为转换前编码

PS:"string".decode( utf-8 ) == unicode( string , utf-8 )

 s = 中文
 print type(s), len(s)
 u = u 中文
 print type(u), len(u)
 u2s = u 中文 .encode( utf-8 )
print type(u2s), len(u2s)

<type str > 6
<type unicode > 2
<type str > 6

console下查看u2s

>>> u 中文 .encode( utf-8 )
ä¸æ

python中定义的一个str变量实则是字节串，由Unicode经过编码(encode)后的字节组成的（也正好印证了utf8编码中一个中文字符是3个字节）

Unicode才是真正意义上的字符串，由字符组成

s = 中文
 # 这时是str，转为unicode需要用decode
 u = s.decode( utf-8 )
 print type(u)
 # 打印 <type  unicode >
# unicode转为str ,使用encode
s2 = u.encode( utf-8 )
print type(s2)
# 打印 <type  str >

新结论：不同编码转换,使用Unicode作为中间编码

#s是code_A的str
s.decode( code_A ).encode( code_B )

在Python 3.x版本中，把 xxx 和u xxx 已经都统一成Unicode编码了，即写不写前缀u都是一样的，而以字节形式表示的字符串则必须加上b前缀：b xxx 。

由于Python源代码也是一个文本文件，所以，当你的源代码中包含中文的时候，在保存源代码时，就需要务必指定保存为UTF-8编码。当Python解释器读取源代码时，为了让它按UTF-8编码读取，我们通常在文件开头写上这两行：

#!/usr/bin/env python
# -*- coding: utf-8 -*-

--## 电子创新网图库均出自电子创新网，版权归属电子创新网，欢迎其他网站、自媒体使用，使用时请注明“图片来自电子创新网图库”，不过本图库图片仅限于网络文章使用，不得用于其他用途，否则我们保留追诉侵权的权利。 ##--

-- 电子创新网合作网站 --

粤ICP备12070055号

推荐文章

无邪的创口贴 · python-2.7 ImportError: No module named request · Issue #4174 · jupyterlab/jupyterlab · GitHub

16 小时前

大方的沙滩裤 · linux 安装python本地依赖包（python 2.7安装 request 依赖）python在线离&线安装request-白眉大叔

16 小时前

礼貌的消炎药 · Activation fails all of a sudden in distributed setup - Troubleshooting - Checkmk Community

16 小时前

耍酷的柳树 · Still cant upgrade to 1.7 - Get Help - OctoPrint Community Forum

16 小时前

瘦瘦的绿茶 · Python用PyQt5实现多种弹出消息框，QMessageBox控件使用详解_网易订阅

14 小时前

至今单身的风衣 · python怎么在屏幕上画图_mob64ca12d2a342的技术博客_51CTO博客

1 周前

阳光的充值卡 · 喵喵早安（简体）(松小兔)-喵喵早安（简体）最新章节-无罪国度的所有小说

1 月前

爱搭讪的蚂蚁 · 筑地市场前身——日本桥鱼河岸的诞生|关东|埼玉|江户|东京_网易订阅

1 月前

高大的冰棍 · 视频｜泰迪熊有过世爸爸的香水味道女儿一闻就认出抱着熊痛哭_手机新浪网

3 月前

还单身的消炎药 · shell 编程 && bash 简介(shell 变量、shell操作环境、数据流重导向、管线命令、shell script) - wendyw - 博客园

8 月前