0

0

PHP数组高级合并技巧:根据共同键收集并整合重复值

心靈之曲

心靈之曲

发布时间:2025-10-01 15:31:00

|

459人浏览过

|

来源于php中文网

原创

PHP数组高级合并技巧:根据共同键收集并整合重复值

本教程详细讲解如何在PHP中将两个数组根据共同的键进行合并,特别处理源数组中存在重复键值的情况。通过遍历目标数组,并利用array_column和array_keys高效查找并收集源数组中所有匹配的字段值,最终将这些值作为子数组整合到目标数组的对应记录中,同时提供性能优化方案。

问题描述与目标

在实际开发中,我们经常会遇到需要将不同数据源的数据进行整合的情况。一个常见的场景是,我们有两个关联数组,它们通过一个共同的标识符(例如epid)进行关联。其中一个数组可能包含多个具有相同标识符的记录,而我们希望将这些重复记录中的特定字段(例如hash)收集起来,并合并到另一个数组中对应标识符的记录下,形成一个子数组。

例如,我们有以下两个数组:

源数组 (Array 1):包含多个epid和hash对,epid可能重复。

$sourceArray = [
    ["epid" => "123", "hash" => "xxxxxxA"],
    ["epid" => "456", "hash" => "xxxxxxB"],
    ["epid" => "789", "hash" => "xxxxxxC"],
    ["epid" => "123", "hash" => "xxxxxxD"],
    ["epid" => "123", "hash" => "xxxxxxE"],
];

目标数组 (Array 2):包含epid和name,每个epid通常是唯一的。

$targetArray = [
    ["epid" => "123", "name" => "This is a title"],
    ["epid" => "456", "name" => "This is a title"],
    ["epid" => "789", "name" => "This is a title"]
];

我们的目标是将sourceArray中所有与targetArray中epid匹配的hash值收集起来,并作为一个hash数组添加到targetArray的对应记录中。期望的输出结果如下:

立即学习PHP免费学习笔记(深入)”;

[
    ["epid" => "123", "name" => "This is a title", "hash" => ["xxxxxxA", "xxxxxxD", "xxxxxxE"]],
    ["epid" => "456", "name" => "This is a title", "hash" => ["xxxxxxB"]],
    ["epid" => "789", "name" => "This is a title", "hash" => ["xxxxxxC"]]
]

核心解决方案

解决这个问题的基本思路是:遍历目标数组的每一个元素,对于每个元素,在源数组中查找所有epid匹配的记录,然后提取这些匹配记录的hash值,并将它们聚合到一个新的hash字段中。

PHP 代码实现

以下是使用PHP实现上述逻辑的代码:

TemPolor
TemPolor

AI音乐生成器,一键创作免版税音乐

下载
<?php

// 示例数据
$sourceArray = [
    ["epid" => "123", "hash" => "xxxxxxA"],
    ["epid" => "456", "hash" => "xxxxxxB"],
    ["epid" => "789", "hash" => "xxxxxxC"],
    ["epid" => "123", "hash" => "xxxxxxD"],
    ["epid" => "123", "hash" => "xxxxxxE"],
];

$targetArray = [
    ["epid" => "123", "name" => "This is a title"],
    ["epid" => "456", "name" => "This is a title"],
    ["epid" => "789", "name" => "This is a title"]
];

// 遍历目标数组并整合数据
foreach ($targetArray as $index => $item) {
    // 1. 从源数组中提取所有 'epid' 列的值
    // 2. 查找这些 'epid' 值中与当前目标项 'epid' 匹配的所有键(索引)
    $matchingKeys = array_keys(array_column($sourceArray, 'epid'), $item["epid"]);

    // 初始化当前目标项的 'hash' 字段为一个空数组,以确保后续可以添加元素
    $targetArray[$index]["hash"] = [];

    // 遍历所有匹配的键,将对应的 'hash' 值添加到目标项的 'hash' 数组中
    foreach ($matchingKeys as $key) {
        $targetArray[$index]["hash"][] = $sourceArray[$key]["hash"];
    }
}

// 输出整合后的结果
echo "<pre class="brush:php;toolbar:false;">";
print_r($targetArray);
echo "
"; ?>

代码解析

  1. foreach ($targetArray as $index => $item): 我们首先遍历targetArray。使用$index可以让我们直接通过索引修改原始$targetArray中的元素。
  2. array_column($sourceArray, 'epid'): 这个函数用于从多维数组中提取某一列的值。在这里,它会从$sourceArray中提取所有epid的值,生成一个一维数组,例如 ["123", "456", "789", "123", "123"]。
  3. array_keys(array_column($sourceArray, 'epid'), $item["epid"]): array_keys()函数用于在数组中搜索给定值,并返回所有匹配的键。结合array_column(),它能够找出$sourceArray中所有epid与当前$item["epid"]匹配的原始索引。例如,当$item["epid"]是"123"时,$matchingKeys将得到 [0, 3, 4]。
  4. $targetArray[$index]["hash"] = [];: 在开始收集hash值之前,我们为当前$targetArray项创建一个空的hash数组。这确保了即使没有匹配的hash值,hash字段也会存在(只是一个空数组),保持数据结构的一致性。
  5. foreach ($matchingKeys as $key): 遍历上一步找到的所有匹配索引。
  6. $targetArray[$index]["hash"][] = $sourceArray[$key]["hash"];: 将$sourceArray中对应索引$key的hash值添加到当前$targetArray项的hash数组中。[]语法用于向数组末尾添加元素。

优化与注意事项

上述解决方案对于中小型数据集是有效且易于理解的。然而,对于非常大的数据集,尤其当$sourceArray和$targetArray都非常庞大时,嵌套循环中重复调用array_column和array_keys可能会导致性能问题,因为它们每次迭代都需要扫描整个$sourceArray。

性能优化:预构建查找表

为了提高效率,我们可以预先对$sourceArray进行处理,构建一个基于epid的哈希查找表。这样,在遍历$targetArray时,每次查找hash值都只需要常数时间(O(1))而不是线性时间(O(N))。

<?php

// 示例数据(同上)
$sourceArray = [
    ["epid" => "123", "hash" => "xxxxxxA"],
    ["epid" => "456", "hash" => "xxxxxxB"],
    ["epid" => "789", "hash" => "xxxxxxC"],
    ["epid" => "123", "hash" => "xxxxxxD"],
    ["epid" => "123", "hash" => "xxxxxxE"],
];

$targetArray = [
    ["epid" => "123", "name" => "This is a title"],
    ["epid" => "456", "name" => "This is a title"],
    ["epid" => "789", "name" => "This is a title"]
];

// 优化方案:预构建哈希查找表
$hashLookup = [];
foreach ($sourceArray as $item) {
    // 将所有相同epid的hash值收集到一个子数组中
    $hashLookup[$item['epid']][] = $item['hash'];
}

// 遍历目标数组,使用查找表进行高效合并
foreach ($targetArray as $index => $item) {
    $epid = $item['epid'];
    if (isset($hashLookup[$epid])) {
        // 如果在查找表中找到匹配的epid,则直接赋值
        $targetArray[$index]['hash'] = $hashLookup[$epid];
    } else {
        // 如果没有匹配的hash,则设置为空数组
        $targetArray[$index]['hash'] = [];
    }
}

// 输出整合后的结果
echo "<pre class="brush:php;toolbar:false;">";
print_r($targetArray);
echo "
"; ?>

优化代码解析:

  1. 构建查找表 ($hashLookup)
    • 我们首先遍历$sourceArray一次。
    • 对于每个元素,我们以其epid作为键,将hash值添加到$hashLookup中对应的数组。如果epid是第一次出现,会自动创建一个新的数组。
    • 例如,$hashLookup会变成:
      [
          "123" => ["xxxxxxA", "xxxxxxD", "xxxxxxE"],
          "456" => ["xxxxxxB"],
          "789" => ["xxxxxxC"]
      ]
    • 这个步骤的时间复杂度是 O(N),其中 N 是$sourceArray的元素数量。
  2. 遍历目标数组并合并
    • 然后,我们遍历$targetArray。
    • 对于每个目标项的epid,我们直接通过isset($hashLookup[$epid])检查查找表中是否存在对应的hash列表。
    • 如果存在,直接将$hashLookup[$epid]的值赋给$targetArray[$index]['hash']。
    • 如果不存在,则将$targetArray[$index]['hash']设置为空数组。
    • 这个步骤的时间复杂度是 O(M),其中 M 是$targetArray的元素数量。每次查找都是 O(1)。

通过这种优化,总的时间复杂度从 O(M * N) 降低到 O(N + M),显著提高了处理大型数据集的性能。

数据完整性与默认值

在合并过程中,如果targetArray中的某个epid在sourceArray中没有对应的hash值,原方案会跳过该epid的hash字段赋值,导致该字段可能不存在。在优化方案中,我们明确地将其初始化为空数组[]。这是一种良好的实践,可以确保最终数据结构的统一性,避免后续处理时因字段缺失而引发错误。

总结

本教程介绍了两种在PHP中合并关联数组并处理重复键值的方法。第一种方法利用array_column和array_keys直接在循环中查找并聚合数据,代码简洁易懂,适用于中小型数据集。第二种方法通过预先构建哈希查找表来优化性能,将时间复杂度从平方级降低到线性级,更适合处理大型数据集,是更专业的解决方案。在实际应用中,应根据数据规模和性能要求选择合适的合并策略,并注意数据结构的统一性。

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

245

2025.12.04

mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

209

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

322

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

292

2025.06.11

c++标识符介绍
c++标识符介绍

本专题整合了c++标识符相关内容,阅读专题下面的文章了解更多详细内容。

177

2025.08.07

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

548

2023.12.01

C++ 高效算法与数据结构
C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化,涵盖排序算法(快速排序、归并排序)、查找算法、图算法、动态规划、贪心算法等,并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构(链表、树、堆、哈希表等),帮助开发者提升 在复杂应用中的算法设计与性能优化能力。

30

2025.12.22

深入理解算法:高效算法与数据结构专题
深入理解算法:高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念,适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用,如数组、链表、栈、队列、哈希表、树、图等;以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析,帮助开发者不仅能熟练运用这些基础知识,还能在实际编程中优化性能,提高代码的执行效率。本专题适合准备面试的开发者,也适合希望提高算法思维的编程爱好者。

44

2026.01.06

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

4

2026.03.10

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.2万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号