ascii码字节数目总结 您所在的位置:网站首页 acs2码值占几个字节 ascii码字节数目总结

ascii码字节数目总结

2024-07-15 06:01| 来源: 网络整理| 查看: 265

ascii 英文字母,特殊字符,数字:一个字节,8位; 万国码Unicode:unicode 最开始16位两个字节,中文不够32位 4个字节。 占用资源多。

升级:utf-8 utf-16 utf-32 utf-8:最少用一个字节,8位表示一个英文。                    欧洲16位,两个字节。                    亚洲 24位,三个字节。 gbk:中国国产,只能用于中文和ascii码中的文字。

中文2个字节,英文字母一个字节  

# 如何将字符串类型转化为bytes类型 # 编码:ascii码(一个字符用一个字节来表述,一个字节占8位), unicode码(32位四个字节), # utf-8(8位一个字节), gbk(8位一个字节) # 1.各个编码之间的二进制,是不能相互识别的,会产生乱码; # 2.文件的储存,传输,不能是unicode,只能是utf-8,utf-16,gbk,gb2312,ascii码 # python3 的 str在内存中是以unicode存储的 # bytes类型 # py中的数据类型有:int,str,bool,list, ,字典,集合,bytes # 如何将str转化位byte类型 # encode是编码,decode是解码 # 为什么将str转化位bytes类型,因为传输和存储必须为bytes类型 s1 = 'alex' s11 = s1.encode('utf-8') print(s11) s2 = '中国' s22 = s2.encode('utf-8') s22 # 每一个字用3个字节来表示 # 1.编码之间的二进制不能相互识别,容易产生乱码; # 2.文件的存储和传输不能是unicode;因为unicode的存储容量太大 # 3.bytes类型的表现形式: # 英文:b+一个英文单词; # 中文:b+16进制;(故py3中文不用bytes) # 所以需要将str转换为bytes,内部是将unicode转换为gbk或utf-8

 



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有