Python 对抗样本生成的 Foolbox 库

舞夢輝影

发布时间：2026-02-22 22:33:10

413人浏览过

来源于php中文网

原创

foolbox攻击报notimplementederror主因是模型未返回可微logits，需设model.train()、禁用softmax、用pytorchmodel指定bounds；pgd不收敛多因stepsize过大或steps不足；tf报numpy错误需启用eager模式；图像发灰系归一化与保存格式不匹配。

python 对抗样本生成的 foolbox 库

为什么 `foolbox` 的攻击在 PyTorch 模型上总报 `NotImplementedError: Cannot differentiate through this function`

因为默认的 foolbox 攻击器（尤其是 v3.x）要求模型返回原始 logits，且必须支持梯度回传；而很多 PyTorch 模型封装后自动调用了 torch.nn.functional.softmax 或 model.eval() 下禁用了梯度，导致攻击中途断掉。

实操建议：

立即学习“Python免费学习笔记（深入）”；

确保模型处于训练模式：model.train()，哪怕只是做推理——foolbox 需要中间层梯度
模型输出必须是未归一化的 logits，不能是 softmax 或 log_softmax 结果；检查 forward 最后一行是不是直接 return logits
用 foolbox.PyTorchModel 包装时，显式传参 bounds=(0, 1) 或对应图像范围，并设 device 与模型一致
若模型有 Dropout 或 BatchNorm，攻击时可能行为不稳定，临时替换为 nn.Identity 更可靠

`foolbox` 的 `PGD` 攻击不收敛、扰动看起来像噪声

这不是模型问题，大概率是步长（stepsize）和迭代次数（steps）没调对。PGD 对超参敏感，尤其在 eps 较小时，过大的 stepsize 会让优化跳过局部极值，结果就是扰动发散、分类置信度乱跳。

实操建议：

立即学习“Python免费学习笔记（深入）”；

stepsize 一般取 eps / 4 到 eps / 2，比如 eps=0.03 时用 stepsize=0.007
steps 至少 10～40；低于 10 很难找到强对抗样本，高于 100 可能过拟合到当前 batch
务必开启 random_start=True（默认是 False），否则从干净样本起点容易陷入弱扰动陷阱
如果攻击目标类别固定（targeted=True），注意目标 label 必须是模型能输出的合法 class index，别越界

用 `foolbox` 测 TensorFlow/Keras 模型时提示 `AttributeError: 'Tensor' object has no attribute 'numpy'`

这是 eager execution 关闭或张量未同步导致的。Foolbox v3+ 内部会尝试把中间结果转成 NumPy 做约束投影（比如 clip 到 [0,1]），但 TF 默认图模式下 Tensor 不支持直接 .numpy()。

剪刀手

全自动AI剪辑神器：日剪千条AI原创视频，零非原创风险，批量高效制作引爆流量！免费体验，轻松上手！

下载

实操建议：

立即学习“Python免费学习笔记（深入）”；

启动脚本开头加 import tensorflow as tf; tf.config.run_functions_eagerly(True)
用 foolbox.TensorFlowModel 包装时，forward 函数返回值必须是 EagerTensor，不能是 SymbolicTensor（即别用 tf.keras.Model 的函数式 API 构建后直接传入）
更稳妥的做法：先把 Keras 模型导出为 SavedModel，再用 tf.keras.models.load_model 加载并确保 training=False 被忽略（因为 Foolbox 需要梯度）
如果只做评估不攻击，可改用 foolbox.attacks.L2BasicIterativeAttack 这类轻量攻击，对 eager 依赖略低

生成的对抗样本保存后图像发灰、对比度崩坏

本质是数据类型溢出或归一化错位。Foolbox 内部按 float32 在 [0,1] 或 [−1,1] 处理图像，但 OpenCV/PIL 保存时默认期待 uint8 的 [0,255]，中间少一次缩放就会全图变暗或死白。

实操建议：

立即学习“Python免费学习笔记（深入）”；

保存前统一做：将对抗样本 tensor clamp 到 [0,1]，再乘 255，再 .byte()（PyTorch）或 .astype(np.uint8)（NumPy）
检查 foolbox.PyTorchModel 初始化时的 bounds 参数是否和你图像预处理一致；例如用 ImageNet 的 [-2.5,2.5] 归一化，就不能设 bounds=(0,1)
用 PIL 保存时别直接传 float tensor，先转 PIL.Image.fromarray(...)；用 OpenCV 时确保通道顺序是 BGR，且输入是 HWC 格式
调试时打印 adv_img.min().item(), adv_img.max().item()，如果远超 [0,1]，说明 eps 太大或 clip 没生效