flask默认开发服务器是单线程阻塞式wsgi服务器,仅适合调试,无法应对并发;上线必须使用gunicorn等生产级服务器,并配合gevent协程模式(需正确配置--worker-class gevent、--worker-connections及前置monkey.patch_all())才能实现高并发异步处理。

为什么默认 Flask 开发服务器扛不住并发
Flask 自带的 app.run() 是单线程阻塞式 WSGI 服务器,只适合本地调试。一开多请求就排队,哪怕只是 5 个并发 curl 就明显卡顿,ConnectionRefused 或超时不是配置问题,是它根本没设计用来跑线上。
上线必须换生产级 WSGI 服务器,Gunicorn 是最常用选择,但它默认仍是同步模式——每个 worker 处理一个请求,CPU 空转等 I/O(比如数据库、HTTP 调用)时无法切走,吞吐上不去。
- 别在
gunicorn -w 4后就以为高并发了:worker 数设再高,同步模式下仍会因 I/O 阻塞而闲置 - gevent 不是“加个参数就变快”,它需要 patch 标准库(尤其是 socket、ssl、thread),漏 patch 会导致协程失效,退化成同步行为
- Flask 应用里用了
time.sleep()、未 patch 的requests、或原生threading.Thread,都会让 gevent 挂起整个 worker
怎么配 Gunicorn + gevent 让 Flask 真正异步起来
核心是两件事:启动时启用 gevent worker 类,并在应用加载前完成标准库 patch。顺序错了,patch 就白做。
- 启动命令必须指定
--worker-class gevent,不能只靠--workers -
--worker-class gevent必须配合--worker-connections(比如1000),它定义每个 gevent worker 最大并发协程数,不设则默认 1000,但低配机器可调低防内存爆 - 在
app.py最顶部(import 任何可能触发 socket 的模块之前)加:from gevent import monkey; monkey.patch_all()
- 如果用了
requests,确保装的是gevent-requests或确认已 patch —— 普通requests在未 patch ssl 时会阻塞整个协程栈
常见报错和对应检查点
部署后请求 502/503 或日志里反复出现 Worker timeout,大概率不是负载高,而是 gevent 没生效或被阻塞。
-
ImportError: No module named 'gevent':Gunicorn 找不到 gevent,确认pip install gevent gunicorn在运行环境里执行过,虚拟环境要激活后再装 -
AssertionError: libev is required:gevent 编译失败,换用pip install --no-binary gevent gevent或升级 pip/cython - 日志里有
BlockingIOError或大量timeout且 CPU 很低:说明协程被阻塞,检查是否漏了monkey.patch_all(),或用了未 patch 的库(如原生subprocess.Popen) - Gunicorn 启动后立即退出,无错误:可能是
app.py导入时报错(比如 patch 前就 import 了 flask.ext.sqlalchemy),把monkey.patch_all()移到文件最顶行
性能差异和实际取舍点
同样 2 核 4G 机器,同步模式(-w 4)压测 QPS 约 200;gevent 模式(-w 2 --worker-class gevent --worker-connections 1000)能到 1200+,但前提是业务逻辑本身不重 CPU、I/O 调用都走 async 友好路径。
- gevent 对 DNS 解析敏感:默认用系统 getaddrinfo,会阻塞。加
monkey.patch_socket(allow_aio=True)或改用dnspython+ 异步 resolver - 数据库驱动必须用异步适配版:SQLite 不行,MySQL 推荐
PyMySQL(已 patch)+SQLAlchemy的NullPool,避免连接池锁死协程 - 别盲目堆
--worker-connections:每个连接占内存,1000 是上限,实际按平均响应时间 × 并发数估算,比如平均 100ms 响应,目标 1000 QPS,只需约 100 连接
真正卡住的地方往往不是配置项,是某个没意识到的同步调用藏在依赖库里——查日志看哪个请求耗时突增,再顺藤摸那个函数是不是用了 os.system、subprocess.call 或未 patch 的 redis.Redis 实例。











