utf8中文编码范围 - 软件自学网

您的位置：首页 > 电脑教程 > 电脑常识 返回首页

时间：2021-03-05 20:10:00 来源：原创

U它可以用来表示Unicode标准中的任何字符，而且其编码中的第一个字节仍与ASCII相容，使得原来处理ASCII字符的软件无须或只进行少部份修改后，便可继续使用。因此，它逐渐成为电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码。
UTF-8基本特征： UCS字符U+0000到U+007F（ASCII）被编码为字节0×00到0x7F（ASCIⅡ兼容）。这意味着只包含7位ASCIl字符的文件在ASCIⅡ和UTF-8两种编码方式下是一样的。所有大于0x007F的UCS字符被编码为一个有多个字节的串，每个字节都有标记位集。因此，ASCIl字节（0x00-0x7F）不可能作为任何其他字符的一部分。表示非ASCIl字符的多字节串的第一个字节总是在0xC0到0XFD的范围里，并指出这个字符包含多少个字节。多字节串的其余字节都在0x80到0xBF范围里。这使得重新同步非常容易，并使编码无国界，且很少受丢失字节的影响。 UTF-8编码字符理论上可以最多到6个字节长，然而16位BMP字符最多只用到3字节长，Bigendian UCS-4字节串的排列顺序是预定的，字节0xFE和OxFF在UTF-8编码中从未用到。 UTF-8编码字节数： UTF-8使用1~4字节为每个字符编码： 1、一个US-ASCIl字符只需1字节编码（Unicode范围由U+0000~U+007F）。 2、带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码（Unicode范围由U+0080~U+07FF）。 3、其他语言的字符（包括中日韩文字、东南亚文字、中东文字等）包含了大部分常用字，使用3字节编码。 4、其他极少使用的语言字符使用4字节编码。 UTF-8编码规则： 如果只有一个字节则其最高二进制位为0；如果是多字节，其第一个字节从最高位开始，连续的二进制位值为1的个数决定了其编码的字节数，其余各字节均以10开头。

上一个电脑教程：dpi是什么意思
下一个电脑教程：项目sop是什么意思

教程分类

热门电脑常识: 1G流量看视频能用多久你知道吗; 电脑应用程序无法正常启动(0xc00; 很多人问1GB是多少兆流量啊我告; 台式电脑如何连接wifi; 快手小店网页版登录入口详情; 怎么查看电脑的Mac地址; qq多彩气泡免费领取; 如何解决电脑显示器有一条横线; 买药哪个网站是正品便宜呢; 电脑无法设置默认保存位置怎么办; 电脑玩4399小游戏显示flash不支; 一兆等于多少kb流量

最新电脑常识: 如何使用命令行修改用户密码？; 如何使用命令行查看用户所属组？; 如何使用命令行启用用户？; 如何使用命令行查看用户信息？; 如何使用命令行添加用户？; 如何使用命令行删除用户？; 如何在Win11系统中使用软链接目; 如何将下载好的离线地图包转移到; 如何在Win11系统中使用离线地图; Win11离线地图完整操作指南; Win11取消登录密码（两种思路，; 显卡升级完整建议（小白友好，分