unicode和utf8

unicode和utf编码

Unicode是什么,Unicode和utf8编码有什么区别,如果把这作为一道面试题,我估计你能够答对的不会超过10%。简单来说,Unicode是一个标准,建立了一个字符到数字的映射,通常用类似U+2630这样的方式来表示。每个字符所对应的数字被称为code points,但是Unicode无法被直接编码,比如2626是应该解释为(26/26)还是(2626)?这就需要字符编码,字节编码对code point进行了相关的转换。

相关的Python函数

chr: 根据code point 获得字符

ord: 根据字符获得code point

struct模块: 字节相关封包和转换

字节解码:bytes.decode

字符串编码: str.encode