Python网络编程核心是理解socket底层机制:它位于OSI传输层,所有库最终调用它;需手动设超时、处理异常、正确编码中文;阻塞、select、asyncio是分层抽象而非替代关系。

Python 网络编程不是靠背模型图,而是靠理解 socket 在哪一层、select 和 asyncio 怎么分工、以及为什么 http.server 不能直接上线。
socket 是唯一真正“联网”的接口
所有 Python 网络库(requests、urllib、aiohttp)最终都调用 socket。它暴露的是操作系统网络栈的最底层能力:绑定地址、监听连接、收发字节流。
常见误区是以为 socket 自带超时或重连——它没有。你得手动设 sock.settimeout(5),否则 recv() 可能永远卡住;你也得自己处理 ConnectionRefusedError 或 BrokenPipeError。
-
AF_INET和SOCK_STREAM是 TCP 场景最常用组合,别一上来就试AF_UNIX - 服务端必须先
bind()再listen(),客户端只需connect();顺序错会报OSError: [Errno 22] Invalid argument - 发送中文必须显式编码:
sock.send("你好".encode("utf-8")),否则TypeError: a bytes-like object is required
阻塞、select、asyncio 不是替代关系,是分层抽象
socket 默认阻塞,一个连接卡住,整个程序停摆。想并发处理多个连接,有三条路:
立即学习“Python免费学习笔记(深入)”;
- 多线程/多进程:每个连接配一个线程,简单但资源开销大,
threading.Thread(target=handle_client, args=(client_sock,)).start() -
select(或poll/epoll):单线程轮询多个 socket 状态,适合中等连接数( -
asyncio:基于事件循环 + 协程,把recv()这类操作包装成await reader.read(1024),逻辑更清晰,但要求所有 I/O 都走异步生态(比如不能混用time.sleep())
注意:asyncio 的 run_in_executor 可以跑阻塞函数,但它只是把线程池藏起来了,并没消除阻塞本身。
HTTP 服务器 ≠ 网络服务器
Python 标准库的 http.server 是个教学工具,不是生产级服务。它用同步 socket + 单线程处理请求,不支持 keep-alive、无请求队列、无 TLS、无静态文件缓存。
真实场景该选什么?
- 轻量 API:用
Flask+gunicorn(多 worker 进程)或FastAPI+uvicorn(异步 event loop) - 需要长连接/推送:绕过 HTTP,直接用
websockets库建 WebSocket 服务,底层仍是asyncio+socket - 调试抓包:用
tcpdump -i lo port 8000看原始字节流,比看框架日志更能定位粘包、半包问题
粘包问题不是协议缺陷,是 TCP 流特性的必然结果
TCP 是字节流,不保证“一次 send() 对应一次 recv()”。你发 200 字节,对方可能分两次收到:120 + 80,也可能合并:一次收到 400 字节(如果之前还有未读数据)。
解决方法只有两种:
- 定长头:先收固定 4 字节表示后续内容长度,再按长度读取,如
struct.unpack("!I", header)[0] - 分隔符:约定用
\n或\0切分消息,但要小心数据本身含分隔符的情况(得转义或改用 TLV)
别指望 socket.setsockopt(SOL_SOCKET, SO_RCVBUF, 65536) 能解决粘包——它只影响内核接收缓冲区大小,不改变流语义。











