Unicode 中 UTF-8编码 和 UTF-16编码详解

2021/4/1 posted in  编译原理

UTF是Unicode TransferFormat的缩写,UTF-8和UTF-16都是把Unicode码转换成程序数据的一种编码方式。

Unicode 的一些特性

最好将 Unicode 看做是已有的各编码系统(它们大多是 8 位的)的统一,而不是一个通用的编码。考虑到要兼容一些古老的编码系统,这个标准包含了一些需要注意的地方,你需要了解它们才能在你的代码里正确地处理 Unicode 字符串。


Reference

这篇文章将 Unicode编码讲的非常清晰
https://my.oschina.net/wangch5453/blog/3044462

Objective-C 的字符串编码
https://objccn.io/issue-9-1/