一个汉字是几个字节 | 您所在的位置:网站首页 › 76字节大约多大 › 一个汉字是几个字节 |
一个汉字是几个字节
常用中文字符用utf-8编码占用3个字节(大约2万多字),但超大字符集中的更大多数汉字要占4个字节(在unicode编码体系中,U+20000开始有5万多汉字)。 GBK、GB2312收编的汉字占2个字节,严格地用iso8859-1无法表示汉字,只能转为问号。 代码演示如下 public static void main(String[] args) throws UnsupportedEncodingException { String s = "我"; System.out.println(s.getBytes("UTF-8").length); byte[] utfBytes = s.getBytes("UTF-8"); for (byte b : utfBytes) { System.out.print(b); } System.out.println(); System.out.println(s.getBytes("GBK").length); byte[] gbkBytes = s.getBytes("GBK"); for (byte b : gbkBytes) { System.out.print(b); } }运行结果: 3 -26,-120,-111 2 -50,-46》》》博主长期更新学习心得,推荐点赞关注!!! 》》》若有错误之处,请在评论区留言,谢谢!!! |
CopyRight 2018-2019 实验室设备网 版权所有 |