Python3中字符编码基于Unicode,str为文本类型,bytes为字节类型,通过encode()和decode()实现转换,文件操作需显式指定encoding如utf-8以避免乱码。

Python3 中的字符编码本质上是处理文本和字节之间的转换方式。Python3 默认使用 Unicode 编码来表示字符串,具体实现上采用的是 UTF-8 作为默认的源文件编码和常用编码格式。
在 Python3 中有两个主要的数据类型需要区分:
字符串要通过编码(encode)转成字节,字节要通过解码(decode)还原成字符串。
实际使用中,你经常需要在字符串和字节之间转换:
立即学习“Python免费学习笔记(深入)”;
"中文".encode('utf-8') → 得到 b'\xe4\xb8\xad\xe6\x96\x87'b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8') → 得到 "中文"如果编码不匹配会导致错误,例如用 gbk 解码一个 UTF-8 的字节流会报 UnicodeDecodeError。
读写文本文件时,推荐显式指定编码方式,避免平台差异问题:
本文档主要讲述的是Android的资源与国际化设置;资源是外部文件(不含代码的文件),它被代码使用并在编译时编入应用程序。Android支持不同类型的资源文件,包括XML,PNG以及JPEG文件XML文件根据描述的不同有不同格式。这份文档描述可以支持什么样的文件,语法,以及各种格式。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看
0
写入时也一样:
with open('output.txt', 'w', encoding='utf-8') as f:如果不指定,Python 会使用系统默认编码(Windows 可能是 gbk,Linux/macOS 通常是 utf-8),容易出错。
可以通过以下代码查看当前默认编码:
import sys这个值通常是 utf-8,但不能修改。所有字符串操作都基于 Unicode,无需手动设置全局编码。
基本上就这些。只要记住:文本用 str,传输用 bytes,转换靠 encode/decode,读写文件加 encoding 参数,就能避开大多数编码问题。
python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号