导语:
本文主要介绍了关于python chardet检测编码的相关知识,包括python 异常,以及python中文编码这些编程知识,希望对大家有参考作用。
1.当我们得到一个字节时,我们可以对其进行检测和编码。使用chardet检测编码,只需要一行代码:
>>> chardet.detect(b'Hello, world!')
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}
检测到的代码是 ascii。注意还有一个confidence字段,表示检测概率为1.0(即100%)。
2、检测GBK编码的中文
>>> data = '离离原上草,一岁一枯荣'.encode('gbk')
>>> chardet.detect(data)
{'encoding': 'GB2312', 'confidence': 0.7407407407407407, 'language': 'Chinese'}
检测到的编码是GB2312。请注意,GBK 是 GB2312 的超集。两者是相同的编码。正确检测的概率为 74%。语言字段指示的语言为“中文”。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何在python中判断整数08/27
- ♥ Python脚本如何调用外部命令12/11
- ♥ 如何检查python3是32位还是64位09/08
- ♥ python如何确定字符串的结束位置08/22
- ♥ 什么是 Python 中的迭代器12/13
- ♥ 其他人如何使用我的 Python 程序10/16
内容反馈