码元(Code unit) 您所在的位置:网站首页 mdn文档中文 码元(Code unit)

码元(Code unit)

2023-03-13 17:50| 来源: 网络整理| 查看: 265

码元是字符编码系统(例如 UTF-8 或 UTF-16)使用的基本组成部分。字符编码系统将一个 Unicode 码位编码为一个或者多个码元。

在 UTF-16(JavaScript 字符串使用的编码系统)中,码元是 16 位值。这意味着索引到字符串或者获取字符串长度等操作将在这些 16 位单元上进行。这些单元不总是一对一地映射到我们可能认为的字符上。

例如,带有附加符号(例如重音符号)的字符有时会使用两个 Unicode 码位表示:

const myString = "\u006E\u0303"; console.log(myString); // ñ console.log(myString.length); // 2

此外,由于并非 Unicode 定义的所有码位都适合 16 位,因此很多 Unicode 码位都编码为一对 UTF-16 码元,称为代理对:

const face = "🥵"; console.log(face.length); // 2

JavaScript String 对象的 codePointAt() 方法可以让你从它的编码形式检索到 Unicode 码位:

const face = "🥵"; console.log(face.codePointAt(0)); // 129397


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有