如何通过JavaScript的异步生成器处理流数据，以及它在Node.js中读取大文件时的应用原理是什么？

狼影

发布时间：2025-09-21 19:25:01

481人浏览过

来源于php中文网

原创

异步生成器通过“拉取”模式解决大文件处理中的内存溢出和背压问题，利用for await...of按需读取数据块，避免一次性加载全部内容，提升稳定性和代码可读性。

如何通过javascript的异步生成器处理流数据，以及它在node.js中读取大文件时的应用原理是什么？

JavaScript的异步生成器为处理流数据提供了一种非常直观且高效的“拉取”模式，它允许我们以同步代码的写法来处理异步数据流，特别是在Node.js中读取大文件时，能有效避免内存溢出，并简化复杂的异步逻辑。

解决方案

异步生成器（

async function*

）本质上是一种特殊的异步函数，它可以在执行过程中暂停，并通过

yield

关键字返回一个值（或一个 Promise），然后等待下一次请求（通过

next()

方法）再继续执行。当与

for await...of

循环结合使用时，这种机制变得异常强大。

在处理流数据时，我们可以将一个数据流（例如Node.js的

fs.createReadStream

）封装在一个异步生成器中。生成器会在每次接收到新的数据块时，通过

yield

将其“吐出”。而外部的

for await...of

循环则会像消费一个同步数组一样，逐个地“拉取”这些数据块。这种模式的妙处在于，它天然地实现了背压（backpressure）机制：如果消费者处理数据块的速度较慢，生成器会暂停从流中读取更多数据，直到消费者准备好接收下一个块。这解决了传统事件监听模式中生产者可能压垮消费者的问题，极大地提升了处理大文件的稳定性和效率，同时让代码逻辑变得更加线性、易于理解和维护。

为什么传统的异步迭代方式在处理大文件时会遇到瓶颈？

我们都知道，Node.js里处理文件最直接的方式可能是

fs.readFile

，但这玩意儿它会把整个文件内容一次性读进内存。想象一下，如果文件有几个GB甚至几十GB，那服务器的内存可就吃不消了，轻则卡顿，重则直接崩溃。这就像你试图把一整头大象塞进一个小冰箱，根本不现实。

立即学习“Java免费学习笔记（深入）”；

另一种稍微好一点的方式是使用

fs.createReadStream

，然后监听

data

、

end

、

error

这些事件。这确实解决了内存问题，因为它是一点一点地把数据块推给你。但问题也随之而来：回调函数嵌套、状态管理变得复杂，尤其当你需要对这些数据块进行一系列复杂的异步处理时，代码很容易变成“回调地狱”，逻辑跳跃，难以追踪。而且，这种“推”的模式下，如果你的数据处理逻辑跟不上数据产生的速度，很容易出现背压问题，缓冲区会越来越大，最终还是可能导致内存飙升，或者数据丢失。我个人就遇到过好几次，因为处理逻辑慢了一拍，结果导致系统资源耗尽，排查起来那叫一个头疼。

如何构建一个基于异步生成器的Node.js大文件读取器？

构建一个基于异步生成器的Node.js大文件读取器其实非常优雅。核心思想就是把Node.js的

Readable

流包装起来，让它变成一个可以被

for await...of

消费的异步可迭代对象。

PaperFake

AI写论文

下载

我们来看一个例子：

import { createReadStream } from 'node:fs';
import { join } from 'node:path';

// 假设我们有一个大文件
const filePath = join(process.cwd(), 'large-file.txt'); // 确保文件存在

/**
 * 创建一个异步生成器，用于从文件流中读取数据块
 * @param {string} path 文件路径
 * @returns {AsyncGenerator<Buffer, void, unknown>} 异步生成器，每次yield一个数据块
 */
async function* readFileChunkByChunk(path) {
    const stream = createReadStream(path, { highWaterMark: 64 * 1024 }); // 每次读取64KB
    stream.setEncoding('utf8'); // 也可以不设置，直接处理Buffer

    let error = null;
    stream.on('error', (err) => {
        error = err;
    });

    for await (const chunk of stream) {
        if (error) {
            throw error; // 如果流发生错误，立即抛出
        }
        yield chunk; // 每次读取到数据块就yield出去
    }

    if (error) {
        throw error; // 确保在流结束前检查是否有错误
    }
    // 流正常结束，生成器完成
}

// 如何使用这个生成器
async function processLargeFile() {
    console.log('开始处理大文件...');
    let totalBytes = 0;
    try {
        for await (const chunk of readFileChunkByChunk(filePath)) {
            // 这里可以对每个chunk进行异步处理，例如：
            // await someAsyncProcessing(chunk);
            totalBytes += chunk.length;
            // 模拟一些处理延迟
            // await new Promise(resolve => setTimeout(resolve, 10));
            // console.log(`处理了 ${chunk.length} 字节，当前总计：${totalBytes} 字节`);
        }
        console.log(`文件处理完成。总共读取了 ${totalBytes} 字节。`);
    } catch (err) {
        console.error('文件处理过程中发生错误:', err);
    }
}

// 运行示例
// processLargeFile();
// 为了演示，你需要先创建一个足够大的文件，例如：
// node -e "require('fs').writeFileSync('large-file.txt', 'a'.repeat(1024 * 1024 * 100))" // 创建一个100MB的文件

在这个例子中，

readFileChunkByChunk

就是一个异步生成器。它内部创建了一个可读流，然后使用

for await (const chunk of stream)

直接迭代这个流。

stream

对象本身是异步可迭代的，所以我们可以直接在生成器内部利用它。每次

stream

吐出一个

chunk

，

readFileChunkByChunk

就通过

yield chunk

把它传给外部的消费者。这样，外部的

processLargeFile

函数就能以一种非常线性和同步的思维方式，逐个处理数据块，而不用担心回调的层层嵌套或内存爆炸。错误处理也变得更加直接，因为

for await...of

循环可以捕获生成器内部抛出的异常。

异步生成器在处理流数据时，其背后的“拉取”机制是如何工作的？

理解异步生成器的“拉取”机制，关键在于区分它和传统的“推送”模式。传统的Node.js事件流（例如

stream.on('data')

）是“推送”模式：数据一旦准备好，就会被推送到监听器那里，不管监听器是否准备好处理。这就像一个水龙头一直开着，水哗哗地流，如果你下面的桶接得慢，水就溢出来了。

而异步生成器则是一种明确的“拉取”模式。当你在

for await...of

循环中迭代一个异步生成器时，每一次循环迭代，实际上都是向生成器发送了一个隐式的

next()

请求。生成器接收到这个请求后，才会继续执行，直到遇到下一个

yield

表达式，或者直到生成器函数执行完毕。它只会“生产”一个值，然后暂停，等待下一个“拉取”信号。

这就像你拿着一个杯子去水龙头下面接水，你接满一杯，水龙头就暂停出水，等你喝完这杯，再去接下一杯。这种节奏由消费者（你的杯子）控制，而不是由生产者（水龙头）控制。

在Node.js流的语境下，

for await (const chunk of stream)

实际上是在底层调用了流的异步迭代器协议。当

for await...of

请求下一个

chunk

时，流会读取一部分数据并

yield

出来。如果消费者处理这个

chunk

需要时间，那么在消费者处理完成并请求下一个

chunk

之前，流会保持暂停状态（或内部缓冲，但不会无限膨胀），不会主动推送更多数据。这种“按需供给”的模式，天然地解决了背压问题，使得我们处理大文件或高频数据流时，能够更好地控制内存使用和系统负载。它将复杂的异步流处理，转化为了一种看似同步的、易于理解和推理的编程模型，这对我个人来说，是JavaScript异步编程领域一个非常重要的进步。

JavaScript字符串重复repeat与填充padStart用法

JavaScript数值绝对值Math-abs与取整函数对比

JavaScript中逻辑空赋值运算符在默认值设定应用

JavaScript在主流浏览器控制台的调试技巧与规范

JavaScript中Math-random生成随机数的操作技巧

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何通过性能API测量页面加载时间，以及这些指标在实际优化中的应用方法有哪些？下一篇：React表单验证：结合Yup实现客户端校验与处理服务端提交错误

作者最新文章

肉类年货批发进货渠道肉类年货在哪里批发

2026-03-07 04:05

小黑盒官网唯一地址_小黑盒游戏平台官网直达

2026-03-08 10:28

键盘快捷键失效怎么办_键盘快捷键设置恢复

2026-03-08 12:36

冬季空调温度多少度最适合老人小孩_冬天敏感人群空调温度设置

2026-03-10 00:27

小遛共享城市入口_小遛电单车已开通服务城市列表查询

2026-03-10 04:27

海鲜冻货年货批发市场海鲜类年货在哪批发

2026-03-10 10:33

什么样的走路姿势最省力每天走多少步最合适

2026-03-11 09:36

2026春节放假安排最新通知 2026年春节放假调休时间表

2026-03-12 08:29

B站如何查看历史记录_B站观看历史查找方式

2026-03-12 11:02

春运抢票新变化_2026年12306便民功能与服务升级

2026-03-13 10:27

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

492

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

382

2023.10.25

c语言const用法

const是关键字，可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍：1、声明常量，const关键字可用于声明常量，常量的值在程序运行期间不可修改，常量可以是基本数据类型，如整数、浮点数、字符等，也可是自定义的数据类型；2、函数参数中的const修饰符，const关键字可用于函数的参数中，表示该参数在函数内部不可修改等等。

562

2023.09.20

js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法，还有更多js正则表达式的相关文章、相关下载、相关课程，供大家免费下载体验。

531

2023.06.20

js获取当前时间

JS全称JavaScript，是一种具有函数优先的轻量级，解释型或即时编译型的编程语言;它是一种属于网络的高级脚本语言，主要用于Web，常用来为网页添加各式各样的动态功能。js怎么获取当前时间呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

576

2023.07.28

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

760

2023.08.03

js是什么意思

JS是JavaScript的缩写，它是一种广泛应用于网页开发的脚本语言。JavaScript是一种解释性的、基于对象和事件驱动的编程语言，通常用于为网页增加交互性和动态性。它可以在网页上实现复杂的功能和效果，如表单验证、页面元素操作、动画效果、数据交互等。

6258

2023.08.17

js删除节点的方法

js删除节点的方法有：1、removeChild()方法，用于从父节点中移除指定的子节点，它需要两个参数，第一个参数是要删除的子节点，第二个参数是父节点；2、parentNode.removeChild()方法，可以直接通过父节点调用来删除子节点；3、remove()方法，可以直接删除节点，而无需指定父节点；4、innerHTML属性，用于删除节点的内容。

492

2023.09.01