
python 3 不支持 `b'%s' % obj` 这类字节串直接格式化内置对象的语法;正确做法是先用字符串格式化(如 `'%s' % obj` 或 `str(obj)`),再显式编码为 bytes(如 `.encode('utf-8')`)。
在 Python 3 中,字节串(bytes)与文本字符串(str)被严格区分:bytes 仅表示原始二进制数据,不承载字符语义;而所有对象的默认字符串表示(如 str(None)、str([1,2]))返回的是 Unicode 字符串(str 类型)。因此,b'%s' % obj 会失败——因为 %s 在字节串上下文中要求右侧操作数本身是 bytes 或实现了 __bytes__(),而 None、int、list 等内置类型并未(也不应)提供字节级格式化协议。
✅ 正确且推荐的做法是两步转换:
- 使用字符串格式化获取人类可读的 Unicode 表示;
- 显式编码为所需字节序列。
# ✅ 推荐:先 str,再 encode
>>> (str(None)).encode('utf-8')
b'None'
>>> ('%s' % 42).encode('utf-8')
b'42'
>>> f'{[1, "hello"]}'.encode('utf-8')
b"[1, 'hello']"⚠️ 注意编码选择:
- 若数据确定只含 ASCII 字符(如纯数字、简单结构),可用 'ascii' 编码,出错时快速暴露非 ASCII 内容:
>>> str(['café']).encode('ascii') # ❌ 抛出 UnicodeEncodeError - 更通用的场景应使用 'utf-8'(推荐默认):
>>> str(['café', '∀', '?']).encode('utf-8') b"['ca\\xc3\\xa9', '\\xe2\\x88\\x80', '\\xf0\\x9f\\x91\\x8d']" - 若需保证输出完全 ASCII 兼容(例如用于调试或日志传输),可使用 ascii() 函数或 %a 格式符,它自动转义非 ASCII 字符为 \xXX、\uXXXX 或 \UXXXXXXXX 形式:
>>> ascii(['café']).encode('ascii') b"['caf\\xe9']" >>> ('%a' % {'name': '李华'}).encode('ascii') b"{'name': 'Li Hua'}" # 实际输出含 \\u674e\\u534e,此处为简化示意
? 总结:Python 3 没有、也不需要“安装”字节串格式化器。这是语言设计的有意取舍——将文本抽象(str)与二进制数据(bytes)解耦,提升编码安全性与语义清晰度。迁移 Python 2 协议代码时,请统一采用 str(...).encode(encoding) 模式,并根据协议要求选择 'utf-8'、'latin-1' 或 'ascii' 编码。
立即学习“Python免费学习笔记(深入)”;










