Python3中str为Unicode字符串,bytes为字节序列,通过encode和decode方法按UTF-8等编码规则相互转换,文件读写和网络传输时需注意模式与编码一致性。

Python3 中主要涉及的编码类型是字符串(str)和字节(bytes),它们之间的转换依赖于字符编码规则,如 UTF-8、ASCII、GBK 等。理解这两类数据类型及其转换方式对处理文本和网络传输非常重要。
str:表示 Unicode 字符串,用于存储人类可读的文本。所有字符串在 Python3 中默认就是 str 类型,使用 Unicode 编码。
bytes:表示原始的字节序列,用于存储二进制数据或在网络中传输的数据。
例如:
立即学习“Python免费学习笔记(深入)”;
"你好" 是 str 类型b"hello" 是 bytes 类型转换需要指定具体的编码格式,常用的是 UTF-8。
str 转 bytes(编码)
.encode(encoding) 方法"中国".encode("utf-8") → b'\xe4\xb8\xad\xe5\x9b\xbd'
utf-8、gbk、ascii(注意:ASCII 不支持中文)bytes 转 str(解码)
.decode(encoding) 方法b'\xe4\xb8\xad\xe5\x9b\xbd'.decode("utf-8") → "中国"
UnicodeDecodeError 或 UnicodeEncodeError 时,检查编码是否一致,可使用 errors='ignore' 或 'replace' 处理异常字符将中文字符串转为 UTF-8 字节再还原:
text = "Python编程"
data = text.encode("utf-8") # str → bytes
print(data) # b'...'
recovered = data.decode("utf-8") # bytes → str
print(recovered) # 输出:Python编程
处理 GBK 编码的旧数据:
gbk_bytes = "你好".encode("gbk")
text = gbk_bytes.decode("gbk")
基本上就这些,掌握 encode 和 decode,明确 str 和 bytes 的区别,就能应对大多数编码问题。
以上就是Python3编码类型有哪些?怎么转换?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号