导语:
本文主要介绍了关于python如何判断中文是否一致的相关知识,包括python中文字符串处理,以及python 中文识别这些编程知识,希望对大家有参考作用。
Python判断两个相等的中文字符串为假,设置两个要比较的字符串的unicode编码为'utf-8'并不能解决问题。具体原因如下:
1.首先检查要比较的两个字符串的编码格式,使用命令:
import chardet
......
string_code = chardet.detect(string_word)
比较两个字符串的编码结果,如下图所示:
一种编码格式是“UTF-8-SIG”,另一种编码格式是“utf-8”。两个字符串的编码格式不同,所以比较的结果不相等;
编码是'UTF-8-SIG',因为文件在存储时是用UTF-8格式编码的,如果文件以UTF-8不带BOM格式存储,读取的数据编码格式自然会变成'utf -8' .
2、文件重新存储为UTF-8无BOM格式,重新比较两个相等的字符串,返回值为True,即两个字符串相等。
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ Python 3.1 有哪些功能11/09
- ♥ Python中xlrd读取的错误处理09/28
- ♥ 如何使用python表示矩阵09/12
- ♥ python如何将值传递给参数01/04
- ♥ unicode和utf-8的比较01/04
- ♥ divmod 在 python 中接受复数形式01/11
内容反馈