推荐在生成器函数开头、首个yield前放置初始化代码,利用其惰性执行特性确保仅首次next()时执行;避免用全局变量标记状态;需多次遍历则改用实现__iter__的类。

可以在生成器函数内部使用一个标志变量,控制初始化逻辑仅在第一次 next() 调用时执行。最自然、推荐的方式是:**把初始化放在生成器的开头,并利用 Python 生成器的惰性执行特性——它只在第一次调用 next() 时才开始运行到第一个 yield**。
✅ 利用生成器启动时机(推荐)
生成器函数体不会在定义或赋值时执行,而是在第一次调用 next()(或进入 for 循环)时才开始运行,直到遇到第一个 yield 暂停。因此,把初始化代码写在第一个 yield 之前即可确保它只执行一次,且恰好发生在首次迭代开始时:
示例:
def my_generator():
# ✅ 这里就是“第一次迭代时做的初始化”
print("【初始化】打开文件、连接数据库、预热缓存...")
data = [10, 20, 30]
for x in data:
yield x * 2gen = my_generator() # 此时什么都没发生
print("生成器已创建,但尚未初始化")
第一次 next —— 初始化代码立即执行,然后产出第一个值
print(next(gen)) # 输出:【初始化】... 和 20
print(next(gen)) # 输出:40(不再初始化)
⚠️ 不要用闭包或类模拟(除非有状态复用需求)
有人会想到用外部变量记录是否初始化过,比如:
立即学习“Python免费学习笔记(深入)”;
initialized = False
def bad_example():
global initialized
if not initialized:
print("初始化")
initialized = True
yield 1
这不可靠:多个生成器实例共享同一全局状态;且无法重用该生成器(如中断后重新迭代)。应避免。
? 需要多次重用?考虑封装成类(可选进阶)
如果需要「同一个生成器对象能被多次遍历」(像内置容器那样),那就不是普通生成器能直接支持的(普通生成器只能遍历一次)。此时应改用自定义迭代器类,在 __iter__ 中做初始化:
-
__iter__每次被调用时都会执行,适合每次新迭代都初始化 -
__next__只负责返回下一个值
示例:
class MyIterable:
def __init__(self, source):
self.source = source
def __iter__(self):
print("【每次迭代前初始化】重置计数器、重建连接...")
self._iter = iter(self.source)
return self
def __next__(self):
return next(self._iter) * 2obj = MyIterable([1, 2, 3])
for x in obj: print(x) # 初始化 + 输出 2, 4, 6
for x in obj: print(x) # 再次初始化 + 输出 2, 4, 6
? 小结关键点
- 普通生成器的函数体在第一次
next()时才开始执行 → 把初始化代码写在第一个yield前是最简洁可靠的方案 - 不要用外部状态标记“是否初始化过”,会破坏生成器的独立性和可重用性
- 若需支持多次遍历(
for多次),就别用函数式生成器,改用实现__iter__的类










