0

0

C++文件压缩工具 基础压缩算法实践

P粉602998670

P粉602998670

发布时间:2025-08-22 14:16:01

|

471人浏览过

|

来源于php中文网

原创

RLE压缩通过记录连续相同字节的重复次数实现数据压缩。程序先读取输入文件并统计相邻相同字节的数量,当字节变化或计数达255时,将计数值和对应字节写入输出文件;解压时读取每对计数与字节,重复写入相应次数。该方法适用于重复数据多的场景,但对随机数据可能增加体积,且需以二进制模式操作文件以避免格式转换。

c++文件压缩工具 基础压缩算法实践

实现一个基础的C++文件压缩工具,可以帮助理解压缩算法的核心思想。虽然现代压缩工具(如gzip、zip)使用复杂算法达到高压缩率,但我们可以从简单的压缩方法入手,比如基于字节频率的RLE(Run-Length Encoding,游程编码)或LZ77的简化版本。本文以RLE为例,展示如何用C++编写一个可运行的文件压缩与解压程序。

什么是RLE压缩算法?

RLE是一种非常基础的无损压缩算法,适用于连续重复数据较多的场景,比如纯色图像或日志文件中的重复字符。其核心思想是:将连续出现的相同字节替换为“字节 + 重复次数”的形式。

例如:

原始数据:A A A B B C C C C
RLE压缩后:3A 2B 4C

在二进制文件中,我们可用两个字节表示一个“块”:第一个字节是重复次数(最多255),第二个字节是实际值。

立即学习C++免费学习笔记(深入)”;

文件压缩实现步骤

以下是在C++中实现RLE压缩的基本流程:

STORYD
STORYD

帮你写出让领导满意的精美文稿

下载
  • 打开输入文件(二进制模式)
  • 逐字节读取,统计连续相同字节的长度
  • 每当遇到不同字节或达到最大重复数(255),将计数和字节写入输出文件
  • 输出文件格式为:[count][value] 的字节对序列

示例代码片段:

#include 
#include 
#include 

bool compressFile(const std::string& inputFile, const std::string& outputFile) {
    std::ifstream fin(inputFile, std::ios::binary);
    std::ofstream fout(outputFile, std::ios::binary);

    if (!fin || !fout) return false;

    char current, prev;
    uint8_t count = 0;

    if (!fin.get(current)) return true; // 空文件

    prev = current;
    count = 1;

    while (fin.get(current)) {
        if (current == prev && count < 255) {
            count++;
        } else {
            fout.put(count);
            fout.put(prev);
            prev = current;
            count = 1;
        }
    }

    // 写入最后一组
    fout.put(count);
    fout.put(prev);

    fin.close();
    fout.close();
    return true;
}

文件解压实现

解压过程是压缩的逆操作:读取每对 [count][value],然后将 value 重复 count 次写入输出文件。

bool decompressFile(const std::string& inputFile, const std::string& outputFile) {
    std::ifstream fin(inputFile, std::ios::binary);
    std::ofstream fout(outputFile, std::ios::binary);

    if (!fin || !fout) return false;

    uint8_t count;
    char value;

    while (fin.get(value)) {
        count = static_cast(fin.get());
        if (fin.eof()) break;

        for (int i = 0; i < count; ++i) {
            fout.put(value);
        }
    }

    fin.close();
    fout.close();
    return true;
}

使用示例与注意事项

你可以这样调用:

int main() {
    compressFile("test.txt", "test.bin");
    decompressFile("test.bin", "recovered.txt");
    return 0;
}

注意事项:

  • RLE只对重复数据有效,随机数据可能反而变大(因每个字符都需额外计数字节)
  • 文件必须以二进制模式打开,避免换行符被转换
  • 本实现未加文件头,实际应用中可加入魔数、版本、原始大小等元信息
  • 可扩展为支持多字节模式或混合编码策略

基本上就这些。这个RLE压缩工具虽然简单,但完整展示了文件读写、二进制处理和基础压缩逻辑,是学习更复杂算法(如Huffman、LZW)的良好起点。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

198

2023.11.20

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

925

2023.09.19

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

165

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

34

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

73

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

2

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

4

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

8

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 7.8万人学习

C 教程
C 教程

共75课时 | 4.3万人学习

C++教程
C++教程

共115课时 | 14.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号