0

0

如何用 JavaScript 递归提取嵌套表格的所有行并导出为标准 CSV

心靈之曲

心靈之曲

发布时间:2026-01-07 15:21:39

|

806人浏览过

|

来源于php中文网

原创

如何用 JavaScript 递归提取嵌套表格的所有行并导出为标准 CSV

本文介绍一种健壮的 javascript 方法,用于遍历含嵌套子表(如 `colspan="3"` 内嵌 `

`)的 html 表格,递归提取所有**有效数据行**(即具有完整列数的 ``),过滤掉仅作容器用途的合并单元格行,最终生成结构清晰、无重复/错位的 csv 文件。

在实际前端开发中,动态渲染的层级化数据(如用户 Profile 及其关联的 Linked Users)常通过嵌套 <table> 实现。但传统遍历 tbody tr 会将包裹子表的 <tr>(如 <td colspan="3">)误判为数据行,导致 CSV 输出混乱——例如把整个嵌套块当作单行输出 "Tom Jack Sam Alex",而非独立的四行。

根本问题在于:需区分“容器行”与“数据行”。理想策略是——忽略所有包含 colspan 或嵌套 <table> 的 <tr> 本身,只提取那些直接包含等量 <td> 单元格(数量匹配表头列数)的 <tr>,并对其中嵌套的 <table> 递归执行相同逻辑。

以下是一个生产就绪的解决方案:

function exportTableToCsv() {
  const table = document.querySelector('table');
  if (!table) return;

  // 提取表头(严格按 th 顺序)
  const headers = Array.from(table.querySelectorAll('thead th'))
    .map(th => sanitizeCell(th.textContent));

  // 获取预期列数(用于过滤无效行)
  const expectedCols = headers.length;

  // 递归收集所有有效数据行(二维数组:[row1, row2, ...])
  function collectRows(rows) {
    const result = [];
    rows.forEach(row => {
      // 跳过含 colspan 的行(通常是容器行)或空行
      const hasColspan = row.querySelector('td[colspan], th[colspan]');
      if (hasColspan) {
        // 查找该行内所有嵌套 table,并递归处理其 tbody tr
        const nestedTables = row.querySelectorAll('table');
        nestedTables.forEach(nestedTable => {
          const nestedTbody = nestedTable.querySelector('tbody');
          if (nestedTbody) {
            result.push(...collectRows(nestedTbody.querySelectorAll('tr')));
          }
        });
        return;
      }

      // 提取当前行的 td/th 文本,跳过空单元格
      const cells = Array.from(row.querySelectorAll('td, th'))
        .map(cell => sanitizeCell(cell.textContent));

      // 仅保留列数匹配表头的有效数据行
      if (cells.length === expectedCols) {
        result.push(cells);
      }
    });
    return result;
  }

  // 开始递归收集(从主 tbody 出发)
  const tbody = table.querySelector('tbody');
  const allDataRows = tbody ? collectRows(tbody.querySelectorAll('tr')) : [];

  // 组装 CSV 字符串(含表头)
  const csvLines = [
    headers.join(','),
    ...allDataRows.map(row => row.join(','))
  ];

  const csvContent = csvLines.join('\n');

  // 触发下载
  downloadCsv(csvContent, 'export.csv');
}

// 辅助函数:清洗单元格内容(处理换行、逗号、引号,符合 RFC 4180)
function sanitizeCell(text) {
  const trimmed = text ? text.trim() : '';
  // 若含换行、逗号或双引号,需用双引号包裹,并转义内部双引号
  if (/[\n",]/.test(trimmed)) {
    return `"${trimmed.replace(/"/g, '""')}"`;
  }
  return trimmed;
}

function downloadCsv(content, filename) {
  const blob = new Blob([content], { type: 'text/csv;charset=utf-8;' });
  const url = URL.createObjectURL(blob);
  const a = document.createElement('a');
  a.href = url;
  a.download = filename;
  document.body.appendChild(a);
  a.click();
  document.body.removeChild(a);
  URL.revokeObjectURL(url);
}

关键设计亮点:

立即学习Java免费学习笔记(深入)”;

腾讯交互翻译
腾讯交互翻译

腾讯AI Lab发布的一款AI辅助翻译产品

下载
  • 精准过滤:通过 cells.length === expectedCols 确保每行数据列数与表头严格对齐,自动剔除 colspan 容器行;
  • 深度递归:对每个含嵌套 <table> 的 <tr>,定位其内部 tbody tr 并递归采集,不遗漏任意层级;
  • CSV 安全转义:sanitizeCell() 遵循 RFC 4180 标准,自动包裹含特殊字符的字段并转义双引号,避免 Excel 解析错误;
  • 健壮容错:支持缺失 thead/tbody、空单元格、混合 th/td 等边缘场景。

⚠️ 注意事项:

  • 该方案假设所有嵌套子表结构与主表一致(列数相同)。若嵌套表列数不同,需扩展逻辑(如映射字段或填充空值);
  • 避免在大型表格(>1000 行)中使用同步递归,可考虑 requestIdleCallback 分片处理;
  • 如需支持中文导出,请确保 Blob 使用 utf-8 编码(已内置),并在 Excel 中用“数据 → 自文本”选择 UTF-8 编码打开。

调用 exportTableToCsv() 即可一键导出符合预期的 CSV:
Tom,20,London
Jack,30,Glasgow
Sam,40,Belfast
Alex,50,Hull
Josh,20,Cardiff

结构清晰、语义准确、开箱即用。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

954

2023.09.19

excel对比两列数据异同
excel对比两列数据异同

Excel作为数据的小型载体,在日常工作中经常会遇到需要核对两列数据的情况,本专题为大家提供excel对比两列数据异同相关的文章,大家可以免费体验。

1453

2023.07.25

excel重复项筛选标色
excel重复项筛选标色

excel的重复项筛选标色功能使我们能够快速找到和处理数据中的重复值。本专题为大家提供excel重复项筛选标色的相关的文章、下载、课程内容,供大家免费下载体验。

428

2023.07.31

excel复制表格怎么复制出来和原来一样大
excel复制表格怎么复制出来和原来一样大

本专题为大家带来excel复制表格怎么复制出来和原来一样大相关文章,帮助大家解决问题。

572

2023.08.02

excel表格斜线一分为二
excel表格斜线一分为二

在Excel表格中,我们可以使用斜线将单元格一分为二。本专题为大家带来excel表格斜线一分为二怎么弄的相关文章,希望可以帮到大家。

1264

2023.08.02

excel斜线表头一分为二
excel斜线表头一分为二

excel斜线表头一分为二的方法有使用合并单元格功能方法、使用文本框功能方法、使用自定义格式方法。本专题为大家提供excel斜线表头一分为二相关的各种文章、以及下载和课程。

376

2023.08.02

绝对引用的输入方法
绝对引用的输入方法

绝对引用允许在公式中引用一个固定的单元格,而不会随着公式的复制和粘贴而改变引用的单元格。本专题为大家提供绝对引用相关内容的文章,大家可以免费体验。

4561

2023.08.09

java导出excel
java导出excel

在Java中,我们可以使用Apache POI库来导出Excel文件。本专题提供java导出excel的相关文章,大家可以免费体验。

464

2023.08.18

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

76

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 6万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 3.4万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号