python UTF-8编码是什么

1、说明

UTF-8编码,即“可变长的编码”。

UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成1个字节,汉字通常是3个字节,很生僻的字符会被编码成4-6个字节。

2、注意点

Python的诞生比Unicode标准早,所以最早的Python只支持ASCII代码。

一般字符串ABC在Python中都是ASCII编码。

使用UTF-8代码还有另一个好处,那就是ASCII代码实际上可以被视为UTF-8代码的一部分。

因此,大量只支持ASCII代码的历史遗留软件可以在UTF-8代码下继续工作。

这就是为什么我们每次使用中文都需要在文件开头声明UTF-8。

以上就是python UTF-8编码的介绍,希望对大家有所帮助。更多Python学习指路:Python基础教程

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。