0

0

PHP怎么实现数据缓存穿透 防止缓存穿透的6个有效策略

裘德小鎮的故事

裘德小鎮的故事

发布时间:2025-07-11 15:11:02

|

751人浏览过

|

来源于php中文网

原创

缓存穿透是指查询一个不存在的数据,导致每次请求都直击数据库,解决核心是即使查不到也要在缓存层处理以避免流量直接冲击数据库。1. 缓存空对象:若数据库无结果,则缓存空值并设短过期时间,优点简单有效但会占用缓存空间;2. 布隆过滤器:前置判断key是否存在,节省空间但存在误判可能;3. 接口层校验:拦截非法请求,降低无效流量但通用性差;4. 互斥锁:缓存失效时保证仅一个线程更新,防止并发穿透但增加复杂度;5. 预加载:定时加载热点数据,减少穿透概率但需预测热点;6. 异步更新:通过消息队列异步加载缓存,减轻数据库压力但系统复杂度上升。

PHP怎么实现数据缓存穿透 防止缓存穿透的6个有效策略

数据缓存穿透,简单来说,就是查询一个数据库里根本不存在的数据,导致每次请求都直击数据库,缓存形同虚设,最终可能压垮数据库。解决它的核心思路是:即使查不到,也要在缓存层做点什么,避免流量直接涌入数据库。

PHP怎么实现数据缓存穿透 防止缓存穿透的6个有效策略

解决方案

PHP怎么实现数据缓存穿透 防止缓存穿透的6个有效策略
  1. 缓存空对象: 这是最直接也最常用的方法。如果数据库查询结果为空,则在缓存中设置一个空对象,比如null,过期时间设置短一些,比如几秒或几分钟。这样,后续的相同请求会直接命中缓存,而不会穿透到数据库。

    立即学习PHP免费学习笔记(深入)”;

    $key = 'user_id_' . $userId;
    $user = $cache->get($key);
    
    if (!$user) {
        $user = $db->getUserById($userId);
    
        if ($user) {
            $cache->set($key, $user, 3600); // 缓存有效数据,有效期1小时
        } else {
            $cache->set($key, null, 60); // 缓存空对象,有效期60秒
        }
    }
    
    if ($user === null) {
        // 处理未找到用户的情况
        echo "User not found.";
    } else {
        // 使用用户信息
        echo "User: " . $user['name'];
    }

    优点: 简单有效。

    PHP怎么实现数据缓存穿透 防止缓存穿透的6个有效策略

    缺点: 缓存了大量无效数据,占用缓存空间。

  2. 布隆过滤器(Bloom Filter): 布隆过滤器是一种概率型数据结构,可以告诉你某个元素“可能存在”或者“一定不存在”。在缓存之前,先通过布隆过滤器判断key是否存在,如果判断不存在,则直接返回,避免查询缓存和数据库。

    // 假设已经初始化了布隆过滤器 $bloomFilter
    $key = 'user_id_' . $userId;
    
    if (!$bloomFilter->mightContain($key)) {
        // 布隆过滤器判断不存在,直接返回
        echo "User not found.";
        return;
    }
    
    $user = $cache->get($key);
    
    if (!$user) {
        $user = $db->getUserById($userId);
    
        if ($user) {
            $cache->set($key, $user, 3600);
            $bloomFilter->add($key); // 将存在的key加入布隆过滤器
        } else {
            $cache->set($key, null, 60);
        }
    }
    
    if ($user === null) {
        echo "User not found.";
    } else {
        echo "User: " . $user['name'];
    }

    优点: 节省缓存空间,效率较高。

    缺点: 存在误判率(false positive),可能会放过一些不存在的key。需要权衡误判率和空间占用。布隆过滤器的维护成本也需要考虑,例如数据更新时如何同步更新布隆过滤器。

  3. 接口层校验: 在接口层增加校验,例如用户ID必须是正整数,或者符合某种格式。不符合规则的请求直接拦截,避免无效请求到达缓存和数据库。

    $userId = $_GET['user_id'];
    
    if (!is_numeric($userId) || $userId <= 0) {
        // 非法用户ID,直接返回错误
        echo "Invalid user ID.";
        return;
    }
    
    // 后续的缓存和数据库查询

    优点: 可以过滤掉大量无效请求,降低缓存和数据库的压力。

    缺点: 需要根据业务场景定制校验规则,通用性较差。

  4. 互斥锁(Mutex): 当缓存失效时,使用互斥锁保证只有一个线程去查询数据库并更新缓存,其他线程等待。可以有效防止大量请求同时穿透到数据库。

    $key = 'user_id_' . $userId;
    $user = $cache->get($key);
    
    if (!$user) {
        $lockKey = 'lock_user_id_' . $userId;
        $lock = $cache->lock($lockKey, 10); // 尝试获取锁,有效期10秒
    
        if ($lock) {
            try {
                $user = $db->getUserById($userId);
    
                if ($user) {
                    $cache->set($key, $user, 3600);
                } else {
                    $cache->set($key, null, 60);
                }
            } finally {
                $cache->unlock($lockKey); // 释放锁
            }
        } else {
            // 获取锁失败,稍后重试
            sleep(1);
            header("Location: ".$_SERVER['REQUEST_URI']); // 简单粗暴的重定向,实际应用中应使用更优雅的方式
            exit;
        }
    }
    
    if ($user === null) {
        echo "User not found.";
    } else {
        echo "User: " . $user['name'];
    }

    优点: 可以有效防止大量请求同时穿透到数据库。

    缺点: 增加了代码复杂度,可能导致死锁。需要选择合适的锁机制,并设置合理的锁过期时间。

  5. 预加载: 定时将数据库中的热点数据加载到缓存中,避免缓存一开始为空,导致所有请求都穿透到数据库。

    // 定时任务,例如使用crontab
    function preloadHotData() {
        $hotUserIds = [1, 2, 3, 4, 5]; // 假设这些是热点用户ID
    
        foreach ($hotUserIds as $userId) {
            $key = 'user_id_' . $userId;
            $user = $db->getUserById($userId);
    
            if ($user) {
                $cache->set($key, $user, 3600);
            }
        }
    }
    
    preloadHotData();

    优点: 可以有效减少缓存穿透的概率。

    缺点: 需要提前预测热点数据,并定期更新缓存。

    科大讯飞-AI虚拟主播
    科大讯飞-AI虚拟主播

    科大讯飞推出的移动互联网智能交互平台,为开发者免费提供:涵盖语音能力增强型SDK,一站式人机智能语音交互解决方案,专业全面的移动应用分析;

    下载
  6. 异步更新: 当缓存失效时,不立即从数据库加载数据,而是通过消息队列等方式异步更新缓存。可以避免大量请求同时等待数据库查询结果。

    // 假设使用了消息队列 $queue
    $key = 'user_id_' . $userId;
    $user = $cache->get($key);
    
    if (!$user) {
        $queue->enqueue('update_user_cache', ['user_id' => $userId]); // 将更新缓存的任务放入消息队列
        // 返回默认值或错误信息
        echo "User data is being updated, please try again later.";
        return;
    }
    
    if ($user === null) {
        echo "User not found.";
    } else {
        echo "User: " . $user['name'];
    }
    
    // 消息队列消费者
    function updateCache($message) {
        $userId = $message['user_id'];
        $key = 'user_id_' . $userId;
        $user = $db->getUserById($userId);
    
        if ($user) {
            $cache->set($key, $user, 3600);
        } else {
            $cache->set($key, null, 60);
        }
    }

    优点: 可以有效降低数据库的压力。

    缺点: 增加了系统的复杂度,需要引入消息队列等组件。数据一致性需要考虑。

缓存雪崩和缓存击穿的区别与预防?

缓存雪崩是指在同一时刻,大量的缓存key同时失效,导致大量请求直接访问数据库,造成数据库压力过大甚至崩溃。缓存击穿是指一个热点key失效,导致大量请求同时访问数据库,造成数据库压力过大。

预防缓存雪崩:

  • 设置不同的过期时间: 避免大量的key同时失效。可以在过期时间上增加一个随机值。
  • 使用多级缓存: 例如使用本地缓存(如PHP数组)和分布式缓存(如Redis)结合。
  • 熔断降级: 当数据库压力过大时,可以暂时停止缓存更新,直接返回默认值或错误信息。

预防缓存击穿:

  • 互斥锁: 如前文所述。
  • 永不过期: 对于热点数据,可以设置永不过期,或者在后台异步更新缓存。

PHP中如何选择合适的缓存方案?

选择合适的缓存方案需要根据具体的业务场景和需求进行权衡。

  • 数据类型: 不同的缓存系统支持的数据类型不同。例如,Redis支持字符串、哈希、列表、集合、有序集合等多种数据类型。
  • 性能: 不同的缓存系统性能不同。例如,Redis的性能通常比Memcached更高。
  • 功能: 不同的缓存系统功能不同。例如,Redis支持事务、持久化、发布/订阅等功能。
  • 复杂度: 不同的缓存系统复杂度不同。例如,Redis的配置和维护比Memcached更复杂。
  • 成本: 不同的缓存系统成本不同。例如,Redis需要更多的服务器资源。

一般来说,对于简单的缓存需求,可以使用Memcached。对于复杂的缓存需求,可以使用Redis。如果需要更高的性能,可以使用Redis集群。如果需要持久化数据,可以使用Redis的RDB或AOF持久化方式。

布隆过滤器的误判率如何计算和优化?

布隆过滤器的误判率取决于两个参数:

  • m: 布隆过滤器的大小(bit位数)。
  • k: 哈希函数的个数。

误判率的计算公式为:(1 - e^(-kn/m))^k,其中n是插入的元素个数。

优化布隆过滤器的误判率:

  • 增加m: 增加布隆过滤器的大小可以降低误判率,但会增加空间占用。
  • 调整k: 调整哈希函数的个数可以优化误判率。一般来说,当k = (m/n) * ln(2)时,误判率最低。

选择合适的m和k需要在空间占用和误判率之间进行权衡。可以使用在线计算器来计算不同m和k值下的误判率。

除了上述方法,还有没有其他防止缓存穿透的策略?

  • 数据预热: 在系统启动时,提前加载一部分数据到缓存中。
  • 监控和告警: 监控缓存的命中率和数据库的负载,及时发现和处理缓存穿透问题。
  • 限流: 对接口进行限流,防止恶意请求导致缓存穿透。

总之,防止缓存穿透需要综合考虑多种因素,选择合适的策略。没有一种方法是万能的,需要根据具体的业务场景进行权衡和选择。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是分布式
什么是分布式

分布式是一种计算和数据处理的方式,将计算任务或数据分散到多个计算机或节点中进行处理。本专题为大家提供分布式相关的文章、下载、课程内容,供大家免费下载体验。

328

2023.08.11

分布式和微服务的区别
分布式和微服务的区别

分布式和微服务的区别在定义和概念、设计思想、粒度和复杂性、服务边界和自治性、技术栈和部署方式等。本专题为大家提供分布式和微服务相关的文章、下载、课程内容,供大家免费下载体验。

235

2023.10.07

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

309

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

222

2025.10.31

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

235

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

437

2024.03.01

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

298

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

212

2023.09.04

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

10

2026.01.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 9.8万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.2万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号