开启Discuz防采集需登录后台,在“全局”→“防采集”中启用混淆字符串,设置每15-30字符插入HTML注释类隐藏内容,结合服务器禁用异常User-Agent、限制RSS输出、启用验证码及登录可见等策略,辅以安全插件与访问监控,形成多层防护,有效抵御普通采集行为。

Discuz 自带一定的防采集机制,虽然不能完全阻止高级采集工具,但可以有效防止普通爬虫和简单的内容抓取。开启防采集功能并设置采集规则,能显著降低内容被轻易复制的风险。
如何开启 Discuz 防采集功能
登录网站后台,进入“全局” → “防采集”设置页面:
- 启用防采集混淆字符串:勾选此项,系统会在帖子内容中插入随机隐藏文字或标签,干扰采集程序识别正文。
- 设置混淆频率:可选择每多少个字符插入一次混淆内容,建议设置为 15-30 字之间,太密集影响阅读,太稀疏效果差。
- 混淆内容类型:支持纯文本、HTML注释或CSS隐藏方式,推荐使用“HTML注释”,对前端无感且对采集干扰强。
采集规则的设置方法
这里的“采集规则”通常指你作为站长希望防范的采集行为特征,Discuz 允许通过以下方式间接应对:
- 限制非浏览器访问:在服务器配置(如 Nginx 或 .htaccess)中禁止 User-Agent 为空或常见爬虫标识的请求。
- 启用验证码机制:在“用户权限”中设置游客或低等级用户浏览帖子需输入验证码,增加批量采集成本。
- 关闭全文 RSS 输出:进入“界面”→“导航设置”→“RSS”,将输出长度设为 0 或仅标题,避免通过 RSS 批量获取内容。
- 动态化页面:对于新发帖或热门帖,可设置部分内容需登录后可见,或使用 JS 动态加载文本,使静态抓取失效。
增强防采集的实用建议
结合插件和外部手段进一步提升防护能力:
- 安装第三方安全插件,如“腾讯防水墙”或“阿里云盾”,可识别异常访问行为并自动拦截。
- 定期更换混淆字符串内容,避免被反向分析破解。
- 对图片添加水印,并使用延迟加载(lazyload),防止直接盗用图床资源。
- 监控日志文件,发现高频 IP 访问特定帖子时,手动加入黑名单或限速。
基本上就这些。Discuz 的防采集功能虽基础,合理配置后仍能起到良好防护作用。关键是结合后台设置、服务器规则与用户权限控制,形成多层防御。不复杂但容易忽略细节。










