0

0

C++怎么实现一个布隆过滤器_C++数据结构与布隆过滤器实现

裘德小鎮的故事

裘德小鎮的故事

发布时间:2025-11-21 16:35:41

|

803人浏览过

|

来源于php中文网

原创

布隆过滤器通过位数组和多个哈希函数判断元素是否存在,C++中可用vector<bool>和std::hash实现,插入时将哈希位置设为1,查询时若所有位均为1则可能存在,允许误判但不漏判。

c++怎么实现一个布隆过滤器_c++数据结构与布隆过滤器实现

布隆过滤器(Bloom Filter)是一种空间效率高、查询速度快的概率型数据结构,用于判断一个元素是否可能在集合中。它允许一定的误判率(即把不在集合中的元素误判为存在),但不会将存在的元素漏判。C++ 中可以通过位数组和多个哈希函数来实现布隆过滤器。

基本原理与设计思路

布隆过滤器的核心是一个长度为 m 的位数组 bitset,初始时所有位都为 0。同时定义 k 个独立的哈希函数,每个函数可以将输入元素映射到位数组的一个位置。

当插入一个元素时:

  • 用 k 个哈希函数计算出 k 个位置
  • 将位数组中这 k 个位置都设为 1

当查询一个元素是否存在时:

立即学习C++免费学习笔记(深入)”;

  • 同样计算出 k 个位置
  • 如果这些位置中有任意一位是 0,则该元素一定不存在
  • 如果所有位都是 1,则该元素可能存在(可能是误判)

核心组件实现

在 C++ 中,我们可以使用 std::vector<bool>std::bitset 来表示位数组。考虑到动态大小,vector<bool> 更灵活。

对于哈希函数,可以使用 STL 提供的 std::hash 模板,并通过加盐或扰动方式生成多个不同的哈希值。

Cliclic AI
Cliclic AI

Cliclic商品背景图编辑器是一款功能强大的AI工具,帮助用户快速生成具有吸引力的商品图背景。

下载

// 示例:使用 std::hash 和扰动生成多个哈希

size_t hash1 = std::hash<T>{}(value);
size_t hash2 = hash1 * 0x9e3779b9 + 0xabcdef12;
for (int i = 0; i < k; ++i) {
  size_t combined_hash = hash1 + i * hash2;
  size_t index = combined_hash % bitset_size;
  bit_array[index] = true;
}

C++ 实现代码示例

以下是一个通用的布隆过滤器模板类实现:

#include <iostream>
#include <vector>
#include <functional>
#include <cmath>

template <typename T>
class BloomFilter {
private:
  std::vector<bool> bit_array;
  size_t size;
  size_t hash_count;
public:
  explicit BloomFilter(size_t n, double fpp) {
    // n: 预期元素数量,fpp: 可接受误判率
    size = static_cast<size_t>(-n * log(fpp) / (log(2)*log(2)));
    hash_count = static_cast<size_t>(size * log(2) / n);
    bit_array.resize(size, false);
  }
  void insert(const T& value) {
    size_t h1 = std::hash<T>{}(value);
    size_t h2 = h1 * 0x9e3779b9 + 0xabcdef12;
    for (size_t i = 0; i < hash_count; ++i) {
      size_t combined_hash = h1 + i * h2;
      size_t index = combined_hash % size;
      bit_array[index] = true;
    }
  }
  bool mightContain(const T& value) const {
    size_t h1 = std::hash<T>{}(value);
    size_t h2 = h1 * 0x9e3779b9 + 0xabcdef12;
    for (size_t i = 0; i < hash_count; ++i) {
      size_t combined_hash = h1 + i * h2;
      size_t index = combined_hash % size;
      if (!bit_array[index]) {
        return false;
      }
    }
    return true;
  }
};

使用示例与注意事项

下面是一个简单使用示例:

int main() {
  BloomFilter<std::string> bf(1000, 0.01); // 支持1000个元素,误判率1%
  bf.insert("hello");
  bf.insert("world");
  std::cout << std::boolalpha;
  std::cout << bf.mightContain("hello") << "\n"; // true
  std::cout << bf.mightContain("test") << "\n"; // 可能为 false 或 true(误判)
  return 0;
}

注意点:

  • 布隆过滤器不支持删除操作(除非使用计数版本 Counting Bloom Filter)
  • 哈希函数的数量和位数组大小需根据预期元素数量和误判率计算
  • std::hash 对某些类型可能不够均匀,可考虑自定义更强哈希
  • vector<bool> 是特化版本,行为类似位集,适合节省空间

基本上就这些。实现一个高效可靠的布隆过滤器关键在于合理选择参数和哈希策略,C++ 提供了足够灵活的工具来完成这一任务。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

564

2023.09.20

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

564

2023.09.20

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1051

2023.08.02

int占多少字节
int占多少字节

int占4个字节,意味着一个int变量可以存储范围在-2,147,483,648到2,147,483,647之间的整数值,在某些情况下也可能是2个字节或8个字节,int是一种常用的数据类型,用于表示整数,需要根据具体情况选择合适的数据类型,以确保程序的正确性和性能。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

614

2024.08.29

c++怎么把double转成int
c++怎么把double转成int

本专题整合了 c++ double相关教程,阅读专题下面的文章了解更多详细内容。

335

2025.08.29

C++中int的含义
C++中int的含义

本专题整合了C++中int相关内容,阅读专题下面的文章了解更多详细内容。

235

2025.08.29

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

ASP 教程
ASP 教程

共34课时 | 5.9万人学习

Vue3.x 工具篇--十天技能课堂
Vue3.x 工具篇--十天技能课堂

共26课时 | 1.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号