Python处理Unicode字符时出现中文乱码的情况

您所在的位置：网站首页 › 亮剑广播剧下载百度网盘 › Python处理Unicode字符时出现中文乱码的情况

Python处理Unicode字符时出现中文乱码的情况

2024-07-09 13:09:50| 来源: 网络整理| 查看: 265

Unicode字符时出现中文乱码

遇见\u开头的编码，如\u0032\u0030\u0031\u0039\u002D\u0031\u0031即为Unicode字符例：\u003C 相当于 python3中最常用的转换方式是

# -*- coding: utf-8 -*- # @Time : 2023/3/15 17:09 # @Author : 红后 # @Email : [email protected] # @blog : https://www.cnblogs.com/Red-Sun # @File : 实例1.py # @Software: PyCharm str1 = '\u4f60\u597d' # python3中只能先编码再解码，python2的话可以直接解码 print(str1.encode('unicode-escape').decode('unicode-escape'))

可如果先经过中文格式编码(UTF-8)再获取Unicode解码的话就会出现中文字符变成混乱符号的情况

# -*- coding: utf-8 -*- # @Time : 2023/3/15 17:09 # @Author : 红后 # @Email : [email protected] # @blog : https://www.cnblogs.com/Red-Sun # @File : 实例2.py # @Software: PyCharm str1 = '\u4f60\u597d' # python3中只能先编码再解码，python2的话可以直接解码 print(str1.encode('unicode-escape').decode('unicode-escape')) print(str1.encode('utf-8').decode('unicode-escape'))

原因：

当对字符串进行编码后，要对其解码变回中文，这是坑就来了，默认先转的中文识别的是gbk格式这才导致我们得到了乱码而不是我们想要的值。

解决方法：

通过raw_unicode_escape，将此str转化为bytes, 再decode为str。从而规避直接转中文导致格式变成gbk的坑

# -*- coding: utf-8 -*- # @Time : 2023/3/15 17:27 # @Author : 红后 # @Email : [email protected] # @blog : https://www.cnblogs.com/Red-Sun # @File : 实例3.py # @Software: PyCharm str1 = '\u4f60\u597d' # python3中只能先编码再解码，python2的话可以直接解码 print(str1.encode('unicode-escape').decode('unicode-escape')) print(str1.encode('raw_unicode_escape').decode('unicode-escape'))

实际应用场景

个人遇见这个问题是在访问一个html页面后，返回给我的是Unicode格式并带中文的标签内容，这时候我就需要将返回过来的内容转换成正常的html标签格式，再从里面获取我需要的标签。 PS：个人遇见的一个内容都是用document.write渲染的页面踩的这个坑将字符串用utf-8编码再用unicode-escape解码会导致如下情况 str1.encode('utf-8').decode('unicode-escape') 现在打印：// éèå¤æ¡ä¿¡æ¯å±ç¤º 正常情况：// 隐藏备案信息展示其中的中文字符都出现该问题，就可以用到上述方法解决。

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

Python处理Unicode字符时出现中文乱码的情况

Python处理Unicode字符时出现中文乱码的情况

今日新闻

点击排行

推荐新闻

图片新闻

专题文章