导语:
本文主要介绍了关于Python字符串中一个汉字占几个字节?的相关知识,包括字符串占用的字节,以及c语言字符串常量占几个字节这些编程知识,希望对大家有参考作用。
Python中的汉字在utf-8编码下占三个字节,在gbk编码下占两个字节。
1、Python中汉字在utf-8编码下示例:
2、Python中汉字在gbk编码下示例:
UTF-8 是 Unicode 的一种实现,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是 0X4E00 到 0x9FA5,指的是 unicode 值。至于utf-8的编码,是由三个字节组织的,所以可以看出unicode给出了一个字符的范围,定义了这个词的编码值。至于具体的实现,有多种实现方式。
GBK的全称是《汉字内码扩展规范》。 GBK编码是基于GB2312-80标准的内码扩展规范。它采用双字节编码方案,编码范围从8140到FEFE(不包括xx7F),共23940个码位,共收录21003个汉字,完全兼容GB2312-80标准.
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ python中的ndarray是什么?08/31
- ♥ python2.7安装失败怎么办11/22
- ♥ python中的socket建立客户端连接11/25
- ♥ Calendar 类如何操作 python3 时间迭代器?01/05
- ♥ python动态规划算法的使用过程12/29
- ♥ Python的md5是什么意思?11/08
内容反馈