中文可以转换成二进制吗?该怎么做? 您所在的位置:网站首页 二进制编码转换器 中文可以转换成二进制吗?该怎么做?

中文可以转换成二进制吗?该怎么做?

2023-03-14 12:19| 来源: 网络整理| 查看: 265

之前讲到过ASCII码表,但是ASCII码表内只能用来表示英文单词和符号,无法表示其他国家语言,那么咱们二进制的计算机是怎么来表示中文的输入及输出呢?

ASCII码表可以表示几百种字母及符号,但是其中有空余的对应处,这些空白作为预留格可以单独对应另外的一张有映射关系的表。

当时最牛的中文映射表就是GB2312,相信大家在Word里面经常可以看到,其实这里的GB2312是指的当时的中文映射表,可以显示2000多个汉字,能满足最基础的汉字输入。

但是这个数量的汉字是远远不够的,所以后来衍生出了GBK1.0,以及GB18030。

再看看全世界:后来为了解决传统字符集、编码方案而诞生了Unicode,也叫万国码,它为每种语言的每个字符设定了统一且唯一的二进制编码。即真正实现了跨语言、跨平台的文本转换处理的功能,拥有110万多个码位。

但是有个问题,ASCII码表中一个英文用到1个字节,而在Unicode中,一个字要用到2个字节,这样老美就不干啦,原本他们做个QQ,只需要100M的空间,这下子为了支持中文,活生生给挤到200M,没有功能上的进步,反而文件又大又笨

于是我们伟大的计算机科学家们为了解决这个问题又创建出来了Unicode的扩展集,且沿用到至今:UTF-8

罗布派克:设计utf-8的猛人,也是开发unix的人之一,同时也是1980年奥运会射箭银牌,还是个业余天文学家

utf-8这个码表中,一个英文或符号用到1个字节,欧洲国家语言一个字母用到2个字节,东亚国家一个字母则用到3个字节,这样一来对文件的大小基本就没有太大影响了。同时也实现了通过二进制来表示各种国家语言

就这么简单

本人长期研究PYTHON以及GO等各类编程语言,以及一些电脑方面的历史、小知识,有不对的地方欢迎批评指正,也欢迎各位联系我,多交流多沟通,希望能和各位一起共同成长。您的关注就是对我们最大的支持!

微信公众号:大熊的Python课堂



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有