utf8和unicode的区别「unicode和utf8」

2023-06-02 18:37:55来源：搜狐

作者:拉丁吴

UTF-8和unicode到底有什么区别？是存储方式不同？编码方式不同？它们看起来似乎很相似，但是实际上他们并不是同一个层次的概念

要想先讲清楚他们的区别，首相应该讲讲Unicode的来由。

众所周知，在盘古开天辟地之前,sorry ,走错片场了(⊙o⊙)…在计算机发明的时候 ,由于计算机你只能表示二进制的数据，美帝人民为了交流通信方便，约定了一个编码系统，就是ASCII码，把abc..xyz...ABC...XYZ...!@#...等字符分别和0,1,2,3,4......对应，发现差不多刚好128个数，半个字节的长度，为了防止以后需要为新的符号编码，于是干脆取一个字节，最高位置为0。后七位从0-127分别对每一个符号编码。于是，计算机每次读取一个字节，然后参照ASCII表把这些编码翻译成字符。美国人民很高兴，拿着自己玩去了.......后来欧洲人也玩计算机，发现不行啊，还有很多符号（法语，德语）ASCII没办法表示啊，于是欧洲人自己也撸了一套编码，一个字节的长度，把最高位也用掉了。这套编码叫ISO。和ASCII表类似，计算机也是每次只读一个字节，然后按照ISO表，解码出字符。于是欧洲人民也很高兴。中国人不高兴了，特么我们汉字有几万个，常用的就有几千个，没有两个字节根本交不了货。于是勤劳勇敢的中国人民就破天荒的用了两个字节来表示中文。整出一套gbk。为了现实我中华民族兼容并蓄，我们兼容了ASCII编码。gbk编码规定，计算机不能在每次都只读一个字节那么死板了，你要先看看第一位是不是为0，要是为0 的话，就当作ASCII码来读入一个字节，不然的话就读入两个字节。

于是天下就很乱了，欧洲人看不懂我们发过去的信息，我们也看不懂他们的东西，美国人看不懂我的东西，不过我们能看懂他们的信息。哈哈。

总之，天下大乱，群雄并起，百姓生灵涂........

这个时候，就有个国际组织站出来了，说，这么着吧，我来撸一套编码，把大家的编码都归纳进来。于是unicode编码就出现了。这套编码表的编号从0一直算到了100多万（三个字节）。每一个区间都对应着一种语言的编码。目前几乎收纳了全世界大部分的字符。所有的字符都有唯一的编号，这就解决了解码的冲突，于是天下大定！但是，unicode把大家都归纳进来，却没有为编码的二进制传输和二进制解码做出规定。只留下一句：大哥只能帮你到这里了。

我知道你一定在想，要个毛的规定啊，每次让计算机读取三个字节然后参照Unicode表解码就好了。想法是好的，但是如果如果类似与1号编码这样的小数据编号也要三个字节的话，那么也就是0x000001,这简直就是浪费啊，明明一个字节就可以表示了，你非得整三个，几个意思啊？
不管怎么样，大哥虽然走了，但是问题还得解决啊，于是，就出现了如下解决方案：uft-8，utf-16，utf-32这些编码方案。utf-16是用两个字节来编码所有的字符，utf-32则选择用4个字节来编码。下面只讲一下utf-8这种解决方案，因为它用的最多，用得最多是因为在当时它的方案最好，最节省资源。
utf-8为了节省资源，采用变长编码，编码长度从1个字节到6个字节不等
utf-8.png
我知道你想说，明明看起来utf-16更加节省资源，节省空间，正常人都看得出来。但实际上，当时，互联网上绝大部分存在的资源都是英文的，英文在utf-16中也是2个字节，而在utf-8中则是1个字节。在当时，显然是utf-8更加节省资源。现在我们在中文世界里来比较他们，则是utf-16更加节省资源。
OK，关于unicode和utf-8的区别已经解释完毕了。下面用一个图来巩固一下那些区别
Unicode与uft-8的结构关系.png

免责声明：本网站所有信息仅供参考，不做交易和服务的根据，如自行使用本网资料发生偏差，本站概不负责，亦不负任何法律责任。涉及到版权或其他问题，请及时联系我们。

相关推荐

utf8和unicode的区别「unicode和utf8」

东洋近代史「东亚近代史」

abc reading怎么样「app童装怎么样」

入驻各大电商平台「电商平台招商入驻」

支付宝花呗（信用购）如何取现方法【24小时在线】

京东白条额度怎么借出来？具体操作步骤如下【24小时在线客服】

猜你喜欢

40亿债券「中国发行2万亿国债意味着什么」

2020年上半年债券市场违约「2021年中国债券市场分析」

当前为什么适合买债券型基金「牛市买债券基金好吗」

债券基金买入计划和方案确定了吗「可转债基金买入时机」

固收加策略是什么「达成目标的策略措施」

外资连续27个月增持中国债券「发行境外债券是利好吗」

外资为何持续增持人民币债券基金「近期大股东增持的股票」

购买债券基金需要注意哪些风险「如何应对风险」

短债基金的风险是什么「短债债券风险」

巨星转债中签可以赚多少「巨星转债」

债券基金风险有多大「债券基金有风险吗?,会赔吗」

固收半月谈什么是债券的期限和久期呢「债券修正久期」

utf8和unicode的区别「unicode和utf8」

2023-06-02 18:37:55来源：搜狐

相关推荐

猜你喜欢

2021-08-31 15:14:15

2021-04-23 19:47:06

2021-04-23 19:47:03

2021-04-23 19:47:01

2021-04-23 17:47:06