编码方式有哪些_简述常用的编码方式

 编码方式有哪些_简述常用的编码方式

1、ASCII码

学过     计算机   的人都知道ASCII码,总共有128个,用一个字节的低7位表示,0~31是控制     字符   如换行回车删除等;32~126是打印字符,可以通过键盘输入并且能够显示出来。

2、ISO-8859-1

128个字符显然是不够用的,于是ISO组织在ASCII码基础上又制定了一些列标准用来扩展ASCII编码,它们是ISO-8859-1~ISO-8859-15,其中ISO-8859-1涵盖了大多数西欧语言字符,所有应用的最广泛。ISO-8859-1仍然是单字节编码,它总共能表示256个字符。

3、GB2312

它的全称是《信息交换用汉字编码字符集基本集》,它是双字节编码,总的编码范围是A1-F7,其中从A1-A9是符号区,总共包含682个符号,从B0-F7是汉字区,包含6763个汉字。

 编码方式有哪些_简述常用的编码方式_设计制作_接口/总线/驱动

4、GBK

全称叫《汉字内码扩展规范》,是国家技术监督局为windows95所制定的新的汉字内码规范,它的出现是为了扩展GB2312,加入更多的汉字,它的编码范围是8140~FEFE(去掉XX7F)总共有23940个码位,它能表示21003个汉字,它的编码是和GB2312兼容的,也就是说用GB2312编码的汉字可以用GBK来解码,并且不会有乱码。

5、GB18030

全称是《信息交换用汉字编码字符集》,是我国的强制标准,它可能是单字节、双字节或者四字节编码,它的编码与GB2312编码兼容,这个虽然是国家标准,但是实际应用系统中使用的并不广泛。

6、UTF-16

说到UTF必须要提到Unicode(Unive     rs   alCode统一码),ISO试图想创建一个全新的超语言字典,世界上所有的语言都可以通过这本字典来相互翻译。可想而知这个字典是多么的复杂,关于Unicode的详细规范可以参考相应文档。Unicode是     Java   和XML的基础,下面详细介绍Unicode在计算机中的     存储   形式。

UTF-16具体定义了Unicode字符在计算机中存取方法。UTF-16用两个字节来表示Unicode转化格式,这个是定长的表示方法,不论什么字符都可以用两个字节表示,两个字节是16个bit,所以叫UTF-16。UTF-16表示字符非常方便,每两个字节表示一个字符,这个在字符串操作时就大大简化了操作,这也是Java以UTF-16作为内存的字符存储格式的一个很重要的原因。

7、UTF-8

UTF-16统一采用两个字节表示一个字符,虽然在表示上非常简单方便,但是也有其缺点,有很大一部分字符用一个字节就可以表示的现在要两个字节表示,存储空间放大了一倍,在现在的网络带宽还非常有限的今天,这样会增大网络传输的流量,而且也没必要。而UTF-8采用了一种变长技术,每个编码区域有不同的字码长度。不同类型的字符可以是由1~6个字节组成。

UTF-8有以下编码规则:

如果一个字节,最高位(第8位)为0,表示这是一个ASCII字符(00-7F)。可见,所有ASCII编码已经是UTF-8了。

如果一个字节,以11开头,连续的1的个数暗示这个字符的字节数,例如:110xxxxx代表它是双字节UTF-8字符的首字节。

如果一个字节,以10开始,表示它不是首字节,需要向前查找才能得到当前字符的首字节。

34
108
0
18

相关资讯

  1. 1、全新的“小米电视助手”App亮相!交互升级成最大亮点4656
  2. 2、日产电动SUVAriya发布续航里程近500公里约28万起3777
  3. 3、Fixnow锂电高压清洗机299元开启众筹!洗车变得简单831
  4. 4、AI换脸术大势将去人体深度伪造技术走向成熟或将上位4635
  5. 5、腾讯宝马合作再度升级!腾讯小场景/微信车载版将上车3293
  6. 6、华为FreeBuds3等设备将登录中国台湾还有智能手表958
  7. 7、还打算买燃油车?英国或在2035年之前禁止销售燃油车1369
  8. 8、LG电子被英媒评为行业顶级品牌OLED电视评分第一423
  9. 9、《风暴舞》中的美女排行,宋妍霏高丽雯上榜,古力娜扎排第几?4661
  10. 10、维珍航空在美业务申请破产为获取16亿美元救助资金4969
全部评论(0)
我也有话说
0
收藏
点赞
顶部