Python3编码如何实现相互转换？

知行编程网 2022-11-28 01:30 知行编程网 | 隐藏边栏 | 4 0

文章评分 0 次，平均分 0.0 ：

导语：本文主要介绍了关于Python3编码如何实现相互转化？的相关知识，希望可以帮到处于编程学习途中的小伙伴

可以

通过 Unicode 编码来进行不同编码之间的相互转化

了解

ASCII

、

Unicode

、

UTF-8

、

GBK

这四种编码的相关概念
不同编码不能相互识别，不能相互转换，会报错或乱码
国际通用标准：Unicode编码不能用于通过网络或硬盘存储的文本传输，因为Unicode使用升级的32位版本，太耗流量和空间
在

Python3

版本中，唯独

string

在内存中的编码方式是

Unicode

, 所以字符串不能直接通过网络传输和存储在文件中
bytes

：也是一种数据类型，不是字节，与

string

类型就像是孪生兄弟

为啥要有

bytes

？

—— bytes

内部编码不是

Unicode

方式，因此可以进行网络传输和文件的存储

前面提到，string 类型却是 Unicode 方式，为啥平时我们用的是 string 而不是 bytes？——因为 bytes 的中文是 16 进制方式存在

因此，一般在需要通过网络进行数据传输或文件存储时，应考虑字节类型

。

s1 = "abc"
s2 = b"abc"
 
print(type(s1))     # <class 'str'>
print(type(s2))     # <class 'bytes'>

string

转化成

bytes

的方法

######## 方法一 ########
# Unicode编码方式的 string --> GBK编码方式的 string --> GBK编码方式的 bytes
# encode    编码
# decode    解码
 
# Python3 版本中，字符串的编码方式就是 Unicode, 所以这里等同于 s = u"中国"
s1 = "中国"
b = s1.encode("gbk")
s2 = b.decode("gbk")
 
print(s1)           # 中国
print(b)            # b'\xd6\xd0\xb9\xfa'
print(s2)           # 中国
print(type(s1))     # <class 'str'>
print(type(b))      # <class 'bytes'>
print(type(s2))     # <class 'str'>
 
# 原因解析：首先 s1 是以 Unicode 编码方式的 string
# 然后 b 是将 Unicode 编码方式的 string 转化成 GBK 编码方式的 bytes
# 最后 s2 是将 GBK 编码方式的 bytes 转化成 Unicode 编码方式的 string
 
 
######## 方法二 ########
# Unicode编码方式的 string --> UTF-8 编码方式的 string --> GBK编码方式的 bytes
 
s1 = "中国"
b = s1.encode("utf-8")
s2 = b.decode("utf-8")
 
print(s1)           # 中国
print(b)            # b'\xe4\xb8\xad\xe5\x9b\xbd'
print(s2)           # 中国
print(type(s1))     # <class 'str'>
print(type(b))      # <class 'bytes'>
print(type(s2))     # <class 'str'>

强调一点：不同编码之间只能通过

Unicode

编码方式来相互转化

以上就是Python3代码之间相互转换的方法。小编测试后发现真实有效~不知道小伙伴们的问题解决了没有，小编期待大家的互动。在下一篇文章中，我们会带来文件在编码方面的操作，大家一定不要错过。

python

本文为原创文章，版权归知行编程网所有，欢迎分享本文，转载请保留出处！

知行编程网关注：1 粉丝：1

这个人很懒，什么都没写

内容反馈

你可能也喜欢

热评文章

联系我们

标签云

推广返利