0

0

如何在 WordPress 站点中精准屏蔽爬虫对特定目录的访问

聖光之護

聖光之護

发布时间:2026-01-23 20:54:10

|

993人浏览过

|

来源于php中文网

原创

如何在 WordPress 站点中精准屏蔽爬虫对特定目录的访问

本文介绍如何通过 `.htaccess` 文件中的 `rewriterule` 规则,仅对指定子目录(如 `/tbd_templates/` 和 `/custom_post/`)返回 403 禁止访问响应,同时不影响 wordpress 正常路由和其他站点功能。

要在 WordPress 环境中精准限制爬虫(如 Googlebot、Bingbot、Baiduspider)访问特定目录(例如 /tbd_templates/ 和 /custom_post/),不能将泛匹配规则(如 .*)直接放在根目录 .htaccess 中——否则会错误拦截所有请求(包括首页)。正确做法是:将路径限定逻辑写入 RewriteRule 的正则模式中,并置于 WordPress 重写规则之前

以下是推荐配置(请插入到 # BEGIN WordPress 注释行之前):

# Block specific bots from accessing sensitive directories
RewriteCond %{HTTP_USER_AGENT} (googlebot|bingbot|Baiduspider) [NC]
RewriteRule ^(tbd_templates|custom_post)($|/) - [F]

关键说明

Bolt.new
Bolt.new

Bolt.new是一个免费的AI全栈开发工具

下载
  • ^(tbd_templates|custom_post)($|/): 正则精确匹配 URL 路径(不带域名和协议),支持两种形式:
    • /tbd_templates(无尾斜杠)
    • /tbd_templates/ 或 /tbd_templates/some-file.php(有尾斜杠或子路径)
  • [F] 标志等价于 [R=403],返回标准 HTTP 403 Forbidden 响应,语义清晰且被主流爬虫正确识别。
  • RewriteEngine On 无需重复声明——WordPress 区块中已启用,且 Apache 指令按顺序执行,前置规则优先生效。
  • 此规则仅作用于符合条件的 User-Agent + 特定路径组合,普通用户、其他爬虫(如 RSS 阅读器)、API 请求等均不受影响。

⚠️ 注意事项

  • 若后续新增受保护目录(如 /staging/),只需扩展正则:^(tbd_templates|custom_post|staging)($|/)
  • 确保该规则位于 # BEGIN WordPress 上方;若放错位置,会被 WordPress 的 RewriteRule . /index.php [L] 拦截并绕过防护。
  • 测试时建议使用 curl -A "Googlebot" 模拟请求验证效果,例如:
    curl -I -A "Googlebot" https://example.com/tbd_templates/
    # 应返回 HTTP/1.1 403 Forbidden
    curl -I -A "Mozilla/5.0" https://example.com/tbd_templates/
    # 应返回 HTTP/1.1 200 OK(正常访问)
  • 如需屏蔽全部爬虫(不限 UA),可简化条件为 RewriteCond %{HTTP_USER_AGENT} .+,但需谨慎评估 SEO 影响。

综上,该方案兼顾安全性、可维护性与兼容性,是 WordPress 站点中实现细粒度爬虫访问控制的标准实践。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

454

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

183

2023.10.30

apache是什么意思
apache是什么意思

Apache是Apache HTTP Server的简称,是一个开源的Web服务器软件。是目前全球使用最广泛的Web服务器软件之一,由Apache软件基金会开发和维护,Apache具有稳定、安全和高性能的特点,得益于其成熟的开发和广泛的应用实践,被广泛用于托管网站、搭建Web应用程序、构建Web服务和代理等场景。本专题为大家提供了Apache相关的各种文章、以及下载和课程,希望对各位有所帮助。

421

2023.08.23

apache启动失败
apache启动失败

Apache启动失败可能有多种原因。需要检查日志文件、检查配置文件等等。想了解更多apache启动的相关内容,可以阅读本专题下面的文章。

939

2024.01.16

Java 流式处理与 Apache Kafka 实战
Java 流式处理与 Apache Kafka 实战

本专题专注讲解 Java 在流式数据处理与消息队列系统中的应用,系统讲解 Apache Kafka 的基础概念、生产者与消费者模型、Kafka Streams 与 KSQL 流式处理框架、实时数据分析与监控,结合实际业务场景,帮助开发者构建 高吞吐量、低延迟的实时数据流管道,实现高效的数据流转与处理。

173

2026.02.04

http500解决方法
http500解决方法

http500解决方法有检查服务器日志、检查代码错误、检查服务器配置、检查文件和目录权限、检查资源不足、更新软件版本、重启服务器或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

495

2023.11.09

http请求415错误怎么解决
http请求415错误怎么解决

解决方法:1、检查请求头中的Content-Type;2、检查请求体中的数据格式;3、使用适当的编码格式;4、使用适当的请求方法;5、检查服务器端的支持情况。更多http请求415错误怎么解决的相关内容,可以阅读下面的文章。

450

2023.11.14

HTTP 503错误解决方法
HTTP 503错误解决方法

HTTP 503错误表示服务器暂时无法处理请求。想了解更多http错误代码的相关内容,可以阅读本专题下面的文章。

3555

2024.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.4万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号