0

0

PHP中处理与聚合多JSON文件数据:按键汇总值教程

碧海醫心

碧海醫心

发布时间:2025-11-20 12:38:23

|

997人浏览过

|

来源于php中文网

原创

PHP中处理与聚合多JSON文件数据:按键汇总值教程

本教程详细介绍了如何在php中高效处理多个json文件,并根据特定键(如`weeknr`)聚合其中的数值型数据。通过`glob`函数遍历文件,`json_decode`解析内容,并利用关联数组的特性进行累加,最终生成结构化的汇总数据,为后续的表格展示奠定基础。

在现代Web开发中,处理和分析大量结构化数据是一项常见任务。当数据分散存储在多个JSON文件中,并且需要根据某个共同的标识符(例如日期、周次或用户ID)进行汇总时,高效的数据处理方法尤为重要。本教程将指导您如何使用PHP读取指定目录下的所有JSON文件,解析其内容,并根据特定的键(例如weeknr)聚合其他数值型字段(如dayhours和tvt),最终生成一个易于展示的汇总数据集。

1. 场景概述

假设您有一系列JSON文件,每个文件代表一个独立的数据记录,其结构如下:

{
    "id": "id_1638974137049",
    "weeknr": 48,
    "dayhours": 5,
    "tvt": 1.25
}

您的目标是遍历所有这些JSON文件,提取每个记录的weeknr、dayhours和tvt,然后按weeknr对dayhours和tvt进行累加,最终得到一个按周次汇总的表格数据,例如:

weeknr tot dayhours tot tvt hours
48 18 4.5
49 20 6.5
50 24 5.5

2. 核心PHP函数与概念

要实现上述目标,我们将主要使用以下PHP函数和编程概念:

星月写作
星月写作

专为网络小说、 剧本创作者打造的AI增效工具

下载

立即学习PHP免费学习笔记(深入)”;

  • glob(): 用于查找与指定模式匹配的文件路径。这对于获取目录中所有JSON文件的列表非常有用。
  • file_get_contents(): 用于将整个文件读入一个字符串。
  • json_decode(): 将JSON格式的字符串解码为PHP变量。当第二个参数设置为true时,它将返回关联数组,这对于通过键访问数据非常方便。
  • foreach循环: 用于遍历数组或对象。
  • 关联数组: PHP中一种强大的数据结构,允许使用命名键来存储和访问值。我们将利用它来以weeknr作为键进行数据聚合。
  • Null合并运算符 (??): PHP 7引入的运算符,用于检查变量是否存在且不为null。如果变量不存在或为null,则使用其右侧的默认值。这在累加操作中非常有用,可以避免在第一次访问某个键时出现“未定义索引”的错误。

3. 实现步骤与代码示例

以下是实现数据读取和聚合的完整PHP代码及详细解释:

<?php

// 1. 定义JSON文件所在的目录
$jsonDir = 'data/*.json'; 

// 2. 使用glob函数获取所有匹配的JSON文件路径
// glob() 返回一个包含所有匹配文件路径的数组
$files = glob($jsonDir); 

// 初始化一个数组,用于存储所有解析后的JSON对象(作为关联数组)
$parsedObjects = [];

// 初始化一个数组,用于存储按周次聚合后的数据
// 结构将是:[weeknr => ['dayhours' => total_dayhours, 'tvt' => total_tvt]]
$weeksData = [];

// 3. 遍历文件列表,读取并解析每个JSON文件
foreach($files as $file) {
    // 读取文件内容为字符串
    $jsonContent = file_get_contents($file);

    // 将JSON字符串解码为PHP关联数组 (第二个参数为 true)
    $data = json_decode($jsonContent, true);

    // 检查JSON解码是否成功,并确保数据结构符合预期
    if (json_last_error() === JSON_ERROR_NONE && is_array($data) && isset($data['weeknr'])) {
        $parsedObjects[] = $data; // 将解析成功的数据添加到 parsedObjects 数组
    } else {
        // 处理JSON解析错误或数据结构不匹配的情况
        error_log("Error decoding JSON from file: $file. Error: " . json_last_error_msg());
    }
}

// 4. 遍历所有解析后的数据对象,进行按周次的聚合
foreach($parsedObjects as $item) {
    $weeknr = $item['weeknr']; // 获取当前项的周次

    // 使用周次作为 $weeksData 数组的键
    // 如果该周次是第一次出现,则 dayhours 和 tvt 的初始值为 0
    // 否则,将其与已有的值进行累加
    $weeksData[$weeknr] = [
        'dayhours' => ($weeksData[$weeknr]['dayhours'] ?? 0) + $item['dayhours'],
        'tvt'      => ($weeksData[$weeknr]['tvt'] ?? 0) + $item['tvt']
    ];
}

// 5. 输出聚合后的数据 (例如,准备用于表格显示)
echo "<h3>按周次汇总的数据:</h3>";
echo "<table border='1'>";
echo "<thead><tr><th>weeknr</th><th>tot dayhours</th><th>tot tvt hours</th></tr></thead>";
echo "<tbody>";

// 对 $weeksData 数组按 weeknr 进行排序(可选,但通常有助于展示)
ksort($weeksData); 

foreach($weeksData as $weeknr => $totals) {
    echo "<tr>";
    echo "<td>" . htmlspecialchars($weeknr) . "</td>";
    echo "<td>" . htmlspecialchars($totals['dayhours']) . "</td>";
    echo "<td>" . htmlspecialchars(sprintf("%.2f", $totals['tvt'])) . "</td>"; // 格式化tvt为两位小数
    echo "</tr>";
}
echo "</tbody>";
echo "</table>";

?>

代码解释:

  1. 文件查找 (glob): glob('data/*.json') 会在当前脚本执行目录下查找 data 子文件夹中所有以 .json 结尾的文件。请确保您的JSON文件位于名为 data 的子目录中。
  2. 文件读取与解码 (file_get_contents, json_decode):
    • 第一个 foreach 循环遍历 glob 找到的每个文件路径。
    • file_get_contents($file) 读取文件的全部内容作为一个字符串。
    • json_decode($jsonContent, true) 将这个JSON字符串解析成一个PHP关联数组。true 参数至关重要,它确保我们得到的是数组而不是对象,方便通过键名直接访问数据。
    • 错误处理: json_last_error() 和 json_last_error_msg() 用于检查JSON解码过程中是否发生错误,这是生产环境中必不可少的健壮性考虑。
  3. 数据聚合 (foreach, 关联数组, ?? 运算符):
    • 第二个 foreach 循环遍历所有已成功解析的JSON数据项 ($parsedObjects)。
    • $weeknr = $item['weeknr']; 提取当前项的周次。
    • $weeksData[$weeknr] 使用 weeknr 作为主键来存储该周次的汇总数据。
    • ($weeksData[$weeknr]['dayhours'] ?? 0) 是这里的关键。它检查 $weeksData[$weeknr]['dayhours'] 是否已经存在并且不是 null。
      • 如果存在,则取其当前值。
      • 如果不存在(即该 weeknr 是第一次出现),则默认使用 0。
    • 然后将当前 $item['dayhours'] 加到这个值上,实现累加。tvt 字段也以同样的方式处理。
  4. 输出结果: 最后的代码段展示了如何将聚合后的 $weeksData 数组格式化为HTML表格进行输出。ksort($weeksData) 可选地按周次(键)对数据进行排序,使输出更具可读性。sprintf("%.2f", $totals['tvt']) 用于将 tvt 值格式化为两位小数。

4. 注意事项与最佳实践

  • 目录结构: 确保您的PHP脚本能够访问到 data 目录及其中的JSON文件。如果脚本和 data 目录不在同一层级,您需要调整 glob 函数中的路径。
  • 错误处理: 在实际应用中,对 file_get_contents 和 json_decode 的返回值进行错误检查是至关重要的。文件可能不存在、不可读,或者JSON内容可能格式不正确。
  • 数据类型: 确保您尝试累加的字段(如 dayhours 和 tvt)确实是数值类型。如果JSON中这些字段是字符串,PHP会在累加时尝试进行类型转换,但这可能导致意外结果。在解析后进行显式类型转换(例如 (float)$item['tvt'])可以提高代码的健壮性。
  • 内存消耗: 对于非常大量的JSON文件或每个文件都非常大的情况,一次性将所有文件内容读入内存 ($parsedObjects 数组) 可能会导致内存不足。在这种情况下,可以考虑在读取并处理完一个文件后立即释放其内存,或者使用流式处理方法。但对于大多数常见场景,上述方法是高效且简洁的。
  • 安全性: 如果JSON文件内容来自不受信任的源,请在输出到HTML时使用 htmlspecialchars() 等函数进行转义,以防止跨站脚本攻击 (XSS)。

5. 总结

通过本教程,您已经掌握了在PHP中处理多个JSON文件的关键技术。从使用 glob 发现文件,到 json_decode 解析内容,再到利用关联数组和 ?? 运算符进行高效的数据聚合,这些技能是处理结构化数据时的宝贵工具。最终生成的汇总数据可以方便地用于生成报表、图表或进一步的数据分析。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

455

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

334

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

数据类型有哪几种
数据类型有哪几种

数据类型有整型、浮点型、字符型、字符串型、布尔型、数组、结构体和枚举等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

336

2023.10.31

php数据类型
php数据类型

本专题整合了php数据类型相关内容,阅读专题下面的文章了解更多详细内容。

224

2025.10.31

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

138

2026.02.12

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

595

2024.04.28

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.3万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号