我们使用python中,遇到爬取网站情况,用到unicode编码,我们需要将它转换为中文,unicode编码转换为中文的方法有四种:
使用unicode_escape 解码、
使用encode()方法转换,再调用bytes.decode()转换为字符串形式、
使用json.loads 解码(为json 格式)、
使用eval(遇到Unicode时就是通过请求爬网)。详情请参阅这篇文章。
方法一:使用unicode_escape 解码
unicode = b'\\u4f60\\u597d'
re = unicode.decode("unicode_escape")
print(re)
返回:你好
方法二:使用encode()方法进行转换,然后调用bytes.decode()转换成字符串形式
s = r'\u4f60\u597d'
print(s.encode().decode("unicode_escape"))
方法三: 使用json.loads 解码(
为json 格式
)
str = '\u4eac\u4e1c\u653e\u517b\u7684\u722c\u866b'
print json.loads('"%s"' %str)
方法四:使用eval(遇到Unicode是通过requests在网上爬取的时候)
response = requests.get(url,headers=headers)
re = eval("u"+"\'"+response.text+"\'")
print(re)
以上就是小编整理的python中将unicode编码转换为中文的方法。希望对你有帮助~
本文为原创文章,版权归知行编程网所有,欢迎分享本文,转载请保留出处!
你可能也喜欢
- ♥ 如何在python中创建浮点变量?08/22
- ♥ 如何用python计算圆的面积08/23
- ♥ python包和文件夹有什么区别09/13
- ♥ 如果你想使用Python生成验证码,你必须阅读这篇文章12/05
- ♥ 如何用python3输出命令行?12/09
- ♥ 如何拼接python变量09/16
内容反馈