0

0

如何防止AI绘画模型生成“不适宜”内容?

月夜之吻

月夜之吻

发布时间:2026-02-05 17:05:03

|

862人浏览过

|

来源于php中文网

原创

应启用内置安全过滤器、净化提示词、部署图像后处理检测、管控模型权重、实施用户级实时拦截。具体包括开启NSFW过滤、替换敏感词为正向描述、用nsfwjs二次检测、禁用不安全模型、前端API层拦截违规提示词。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如何防止ai绘画模型生成“不适宜”内容?

如果您使用AI绘画模型生成图像,但发现输出内容包含违反社会公序良俗、违法或敏感信息,则可能是由于模型缺乏有效的内容约束机制。以下是防止AI绘画模型生成“不适宜”内容的多种方法:

一、启用内置内容安全过滤器

多数主流AI绘画平台(如Stable Diffusion WebUI、DALL·E、MidJourney v6)集成了基于关键词与图像特征的双重内容安全过滤模块,该模块可在推理前拦截高风险提示词,并在生成后对图像进行合规性扫描。

1、在Stable Diffusion WebUI中,确认已安装并启用SD-WebUI-Safe-TensorPrompt-Translator + NSFW-Filter扩展插件。

2、于设置页面勾选Enable NSFW filter during generation选项,并将过滤强度设为Medium或High

3、在DALL·E API调用时,在请求参数中明确设置"safety_check": true"moderation_level": "strict"

二、前置提示词净化与重写

提示词(prompt)是AI绘画的直接输入指令,其中隐含的语义偏差可能绕过基础过滤。通过结构化清洗与语义重写,可从源头降低违规触发概率。

1、移除所有含人体解剖细节、暴露部位、暴力动词、政治符号、宗教敏感词的原始提示片段。

2、使用正向强化替代负向规避,例如将“不穿衣服”替换为“穿着得体的现代休闲装”,将“血腥场景”替换为“黄昏街道,空旷安静,暖色调光影”

3、在提示词末尾统一追加标准化安全后缀:“masterpiece, best quality, no nudity, no violence, no weapons, no logos, no text, safe for work”

三、部署本地化图像后处理检测

生成后的图像可能通过过滤器漏检,需引入独立的计算机视觉模型进行二次判别,确保输出符合预设合规阈值。

1、下载并运行开源NSFW检测模型nsfwjs(TensorFlow.js版)或deepface中的content_safety模块。

科大讯飞-AI虚拟主播
科大讯飞-AI虚拟主播

科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析;

下载

2、将生成图像以base64编码传入检测接口,解析返回的分类置信度,若"porn"、"hentai"或"sexy"任一类别得分>0.85,则自动丢弃该图像。

3、配置自动化脚本,在保存图像前执行检测,仅当所有类别得分均低于阈值时才写入磁盘,并记录日志中的原始prompt哈希值。

四、限制模型权重与训练数据范围

部分微调模型(LoRA、Textual Inversion)或自定义检查点可能内嵌未经审核的训练样本,导致输出不可控。通过权重级管控可切断潜在风险源。

1、禁用所有来源不明的第三方checkpoint文件,仅使用Hugging Face官方仓库中标注为"safe-for-work" or "SFW-only"的模型权重。

2、在加载LoRA时,检查其metadata.json中是否包含"unsafe_keywords": []字段,且该字段值为空数组。

3、对本地部署的Stable Diffusion模型,运行safetensors-validator工具扫描模型文件,拒绝加载含"bad_prompt_embedding"或"nsfw_token_id"特征的权重层。

五、实施用户级提示词实时拦截规则

面向多用户环境(如企业内部绘图平台),需在前端与API网关层建立动态提示词策略引擎,实现毫秒级拦截。

1、在Web前端输入框绑定oninput事件,调用本地轻量级匹配器,实时高亮并阻止输入含正则表达式/\b(nude|xxx|kill|bomb)\b/i的字符串。

2、在API网关(如Kong或Nginx+Lua)中配置提示词审查规则,对POST请求体中的prompt字段执行AC自动机多模匹配,命中即返回HTTP 400错误及错误码ERR_PROMPT_BLOCKED_007

3、为每个注册用户分配独立的白名单token集合,仅允许其使用经管理员审批的提示词子集,超出范围的输入将被自动替换为默认安全提示模板。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java连接字符串方法汇总
java连接字符串方法汇总

本专题整合了java连接字符串教程合集,阅读专题下面的文章了解更多详细操作。

7

2026.02.05

java中fail含义
java中fail含义

本专题整合了java中fail的含义、作用相关内容,阅读专题下面的文章了解更多详细内容。

8

2026.02.05

控制反转和依赖注入区别
控制反转和依赖注入区别

本专题整合了控制反转和依赖注入区别、解释、实现方法相关内容。阅读专题下面的文章了解更多详细教程。

11

2026.02.05

钉钉脑图插图教程合集
钉钉脑图插图教程合集

本专题整合了钉钉脑图怎么插入图片、钉钉脑图怎么用相关教程,阅读专题下面的文章了解更多详细内容。

24

2026.02.05

python截取字符串方法汇总
python截取字符串方法汇总

本专题整合了python截取字符串方法相关合集,阅读专题下面的文章了解更多详细内容。

2

2026.02.05

Java截取字符串方法合集
Java截取字符串方法合集

本专题整合了Java截取字符串方法汇总,阅读专题下面的文章了解更多详细操作教程。

1

2026.02.05

java 抽象方法
java 抽象方法

本专题整合了java抽象方法定义、作用教程等内容,阅读专题下面的文章了解更多详细内容。

2

2026.02.05

Eclipse创建jsp文件教程合集
Eclipse创建jsp文件教程合集

本专题整合了Eclipse创建jsp文件、创建jsp项目等等内容,阅读专题下面的文章了解更多详细教程。

26

2026.02.05

java 字符串转数字
java 字符串转数字

本专题整合了java如何字符串转数字相关内容,阅读专题下面的文章了解更多详细教程。

4

2026.02.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 8.8万人学习

JS进阶与BootStrap学习
JS进阶与BootStrap学习

共39课时 | 3.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号