0

0

如何在c++中实现一个高效的稀疏矩阵? (压缩存储格式)

穿越時空

穿越時空

发布时间:2026-01-14 16:33:40

|

376人浏览过

|

来源于php中文网

原创

CSR格式是C++中平衡内存、随机访问和乘法性能的首选稀疏矩阵表示,适用于行遍历多、列访问少的场景;其核心为row_ptr、col_indices和values三个数组,构建需两趟扫描或先COO后转换,避免频繁单点插入。

如何在c++中实现一个高效的稀疏矩阵? (压缩存储格式)

用 CSR 格式实现稀疏矩阵最实用

CSR(Compressed Sparse Row)是 C++ 中平衡内存、随机访问和乘法性能的首选压缩格式,尤其适合行遍历多、列访问少的场景(如大多数线性代数库和图算法)。它不支持高效列插入,但对已知非零结构的矩阵初始化和矩阵-向量乘非常快。

  • row_ptr 是长度为 n_rows + 1 的数组,row_ptr[i] 表示第 i 行第一个非零元在 valuescol_indices 中的起始下标
  • col_indices 存储每个非零元的列号(按行优先顺序)
  • values 存储对应非零值,与 col_indices 一一对应
  • 构造时需先统计每行非零个数,再做两趟扫描——这是避免动态重分配的关键

别直接手写 insert(),先用 COO 构建再转 CSR

频繁单点插入会破坏 CSR 的紧凑性,导致 O(n) 查找或 O(nnz) 重排。正确做法是:收集三元组 (row, col, value)std::vector,排序后去重(可选),最后一次性构建 CSR。

  • 排序用 std::sortrow 主序、col 次序:
    std::sort(triplets.begin(), triplets.end(),
        [](const auto& a, const auto& b) {
            return a.row != b.row ? a.row < b.row : a.col < b.col;
        });
  • 去重合并(如相同位置多次赋值)需手动遍历合并,不能依赖 std::unique
  • 转换时用 row_ptr[0] = 0,然后对每行计数填 row_ptr[i+1] = row_ptr[i] + count_of_row_i

矩阵-向量乘 y = A·x 必须手写循环,别依赖 operator[]

CSR 的核心优势在 y[i] += values[k] * x[col_indices[k]] 这种无分支密集访存,而通用 operator()(i,j) 查找会退化成 O(nnz) 每次调用。

  • 典型乘法循环结构:
    for (int i = 0; i < n_rows; ++i) {
        y[i] = 0.0;
        for (int k = row_ptr[i]; k < row_ptr[i+1]; ++k) {
            y[i] += values[k] * x[col_indices[k]];
        }
    }
  • x 很大且稀疏,可考虑转置 CSR(CSC)或引入索引过滤,但通常不值得
  • 注意 col_indices[k] 必须在 [0, n_cols) 范围内,否则是数据损坏,不是越界检查问题

用 std::vector 管理内存,但避免 vector

std::vectorstd::vector 是 CSR 的标准选择;vector 是位压缩特化,不满足 RandomAccessIterator 要求,会导致 data() 失效、迭代器失效、无法传给 BLAS 接口。

MotionGo
MotionGo

AI智能对话式PPT创作,输入内容一键即可完成

下载

立即学习C++免费学习笔记(深入)”;

  • 三个核心缓冲区声明应为:
    std::vector values;
    std::vector col_indices;
    std::vector row_ptr;
  • 如果需要只读共享(如多个算法共用同一矩阵),可包装为 struct 并提供 const 成员函数,但不要用 shared_ptr 包裹原始指针——这增加间接层且无必要
  • 对超大规模矩阵(>10M 非零元),考虑用 std::vectorreserve() 预分配,避免多次 realloc

CSR 的真正复杂点不在结构本身,而在构建阶段的排序/去重逻辑和乘法循环中对 row_ptr 边界的精确把握——这两处出错不会崩溃,但结果全错,且难以调试。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

385

2023.09.04

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

523

2023.09.20

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1017

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

62

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

397

2025.12.29

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

400

2023.08.14

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

36

2026.01.14

php与html混编教程大全
php与html混编教程大全

本专题整合了php和html混编相关教程,阅读专题下面的文章了解更多详细内容。

16

2026.01.13

PHP 高性能
PHP 高性能

本专题整合了PHP高性能相关教程大全,阅读专题下面的文章了解更多详细内容。

34

2026.01.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
SQL 教程
SQL 教程

共61课时 | 3.4万人学习

PostgreSQL 教程
PostgreSQL 教程

共48课时 | 7.1万人学习

好课诞生记
好课诞生记

共20课时 | 6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号