0

0

如何用Node.js Stream处理大文件而不耗尽内存?

狼影

狼影

发布时间:2025-10-03 14:04:02

|

390人浏览过

|

来源于php中文网

原创

使用Node.js流可避免大文件内存溢出,通过fs.createReadStream分块读取,配合pipe实现高效数据传输与Transform流处理数据转换,确保低内存占用。

如何用node.js stream处理大文件而不耗尽内存?

处理大文件时,如果一次性将整个文件读入内存,很容易导致内存溢出。Node.js 的 Stream 模型正是为这类场景设计的——它允许你以“流”的方式逐块处理数据,从而避免内存压力。

使用可读流分块读取文件

通过 fs.createReadStream() 创建一个可读流,文件会被分成小块(chunks)逐步读取,而不是全部加载到内存中。

例如,读取一个 1GB 的日志文件:

const fs = require('fs');
<p>const readStream = fs.createReadStream('large-file.log', {
encoding: 'utf8',
highWaterMark: 64 * 1024 // 每次读取 64KB
});</p><p>readStream.on('data', (chunk) => {
// 处理每个数据块,比如搜索关键词
console.log(<code>Received chunk of ${chunk.length} characters</code>);
});</p><p>readStream.on('end', () => {
console.log('文件读取完成');
});</p><p>readStream.on('error', (err) => {
console.error('读取出错:', err);
});</p>

highWaterMark 控制每次读取的数据量,可根据系统资源调整,避免过小影响性能或过大占用内存。

通过管道(pipe)高效传输数据

最安全高效的方式是使用 pipe() 方法,它自动处理背压(backpressure),确保写入速度跟不上时暂停读取。

比如复制大文件:

const fs = require('fs');
<p>const readStream = fs.createReadStream('source-big-file.zip');
const writeStream = fs.createWriteStream('copy-big-file.zip');</p><p>readStream.pipe(writeStream);</p><div class="aritcle_card flexRow">
                                                        <div class="artcardd flexRow">
                                                                <a class="aritcle_card_img" href="/ai/1412" title="聚好用AI"><img
                                                                                src="https://img.php.cn/upload/ai_manual/000/000/000/175680059460782.png" alt="聚好用AI"  onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
                                                                <div class="aritcle_card_info flexColumn">
                                                                        <a href="/ai/1412" title="聚好用AI">聚好用AI</a>
                                                                        <p>可免费AI绘图、AI音乐、AI视频创作,聚集全球顶级AI,一站式创意平台</p>
                                                                </div>
                                                                <a href="/ai/1412" title="聚好用AI" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
                                                        </div>
                                                </div><p>writeStream.on('finish', () => {
console.log('文件复制完成');
});</p>

这种方式几乎不消耗额外内存,因为数据从源流直接“流入”目标流,中间不会堆积。

在流中进行转换处理

如果需要修改内容(如压缩、过滤、转码),可以插入一个 Transform 流。

例如,将文本转为大写并写入新文件:

const fs = require('fs');
const { Transform } = require('stream');
<p>const upperCaseTransform = new Transform({
transform(chunk, encoding, callback) {
callback(null, chunk.toString().toUpperCase());
}
});</p><p>const readStream = fs.createReadStream('input.txt');
const writeStream = fs.createWriteStream('output.txt');</p><p>readStream.pipe(upperCaseTransform).pipe(writeStream);</p>

Transform 流天然支持背压管理,确保处理节奏与数据流动匹配。

基本上就这些。用好可读流、可写流和 pipe,再结合 Transform 做中间处理,就能轻松应对 GB 级文件而不担心内存爆炸。关键是避免把整个文件塞进内存,始终以“流”的思维来设计数据流动。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

447

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

531

2023.06.20

js获取当前时间
js获取当前时间

JS全称JavaScript,是一种具有函数优先的轻量级,解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言,主要用于Web,常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

576

2023.07.28

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

761

2023.08.03

js是什么意思
js是什么意思

JS是JavaScript的缩写,它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言,通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果,如表单验证、页面元素操作、动画效果、数据交互等。

6279

2023.08.17

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

493

2023.09.01

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

221

2023.09.04

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Node.js 教程
Node.js 教程

共57课时 | 13.4万人学习

【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2.1万人学习

Node.js-前端工程化必学
Node.js-前端工程化必学

共19课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号