可以
通过 Unicode 编码来进行不同编码之间的相互转化
-
了解
ASCII
、
Unicode
、
UTF-8
、
GBK
这四种编码的相关概念
-
不同编码不能相互识别,不能相互转换,会报错或乱码
-
国际通用标准:Unicode编码不能用于通过网络或硬盘存储的文本传输,因为Unicode使用升级的32位版本,太耗流量和空间
-
在
Python3
版本中,唯独
string
在内存中的编码方式是
Unicode
, 所以字符串不能直接通过网络传输和存储在文件中
-
bytes
:也是一种数据类型,不是字节,与
string
类型就像是孪生兄弟
为啥要有
bytes
?
—— bytes
内部编码不是
Unicode
方式,因此可以进行网络传输和文件的存储
前面提到,string 类型却是 Unicode 方式,为啥平时我们用的是 string 而不是 bytes?——因为 bytes 的中文是 16 进制方式存在
因此,一般在需要通过网络进行数据传输或文件存储时,应考虑字节类型
。
s1 = "abc"
s2 = b"abc"
print(type(s1)) # <class 'str'>
print(type(s2)) # <class 'bytes'>
string
转化成
bytes
的方法
######## 方法一 ########
# Unicode编码方式的 string --> GBK编码方式的 string --> GBK编码方式的 bytes
# encode 编码
# decode 解码
# Python3 版本中,字符串的编码方式就是 Unicode, 所以这里等同于 s = u"中国"
s1 = "中国"
b = s1.encode("gbk")
s2 = b.decode("gbk")
print(s1) # 中国
print(b) # b'\xd6\xd0\xb9\xfa'
print(s2) # 中国
print(type(s1)) # <class 'str'>
print(type(b)) # <class 'bytes'>
print(type(s2)) # <class 'str'>
# 原因解析:首先 s1 是以 Unicode 编码方式的 string
# 然后 b 是将 Unicode 编码方式的 string 转化成 GBK 编码方式的 bytes
# 最后 s2 是将 GBK 编码方式的 bytes 转化成 Unicode 编码方式的 string
######## 方法二 ########
# Unicode编码方式的 string --> UTF-8 编码方式的 string --> GBK编码方式的 bytes
s1 = "中国"
b = s1.encode("utf-8")
s2 = b.decode("utf-8")
print(s1) # 中国
print(b) # b'\xe4\xb8\xad\xe5\x9b\xbd'
print(s2) # 中国
print(type(s1)) # <class 'str'>
print(type(b)) # <class 'bytes'>
print(type(s2)) # <class 'str'>
强调一点:不同编码之间只能通过
Unicode
编码方式来相互转化
以上就是Python3代码之间相互转换的方法。小编测试后发现真实有效~不知道小伙伴们的问题解决了没有,小编期待大家的互动。在下一篇文章中,我们会带来文件在编码方面的操作,大家一定不要错过。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python中的reduce函数是如何实现阶乘的?11/13
- ♥ python如何调用方法10/01
- ♥ python如何在numpy中使用size()函数?10/19
- ♥ python如何导入re包10/21
- ♥ 如何在python中绘制子图函数?08/24
- ♥ 如何在python中查看模块源代码08/25
内容反馈