如何按日期和网站名去重并保留最大粉丝数的对象

霞舞

发布时间：2026-01-27 12:59:00

449人浏览过

来源于php中文网

原创

如何按日期和网站名去重并保留最大粉丝数的对象

本文介绍如何对嵌套 json 数据按 `date` 分组，再在每组的 `websites` 数组中基于 `website_name` 去重，并仅保留 `num_followers` 数值最大的对象（字符串数值按字典序比较时需注意，实际应转为整型确保正确性）。

在社交媒体数据聚合场景中，常会遇到同一日期下多个同名平台（如多个 "instagram"）记录，但只需保留粉丝数最高的那条。原始数据结构为日期数组，每项含 websites 子数组，目标是：每个 date 下，每个 website_name 仅保留一条记录，且该记录的 num_followers 为该名称下的最大值。

实现逻辑分三步：

按日期遍历：对输入 JSON 解析后的每条日期数据单独处理；
按网站名聚合：使用关联数组以 website_name 为键，动态维护当前已见的最大 num_followers 对应的对象；
类型安全比较：由于 num_followers 在示例中为字符串（如 "123146780"），直接字符串比较在位数相同时有效，但为健壮性，强烈建议转换为整型比较，避免 "9" youjiankuohaophpcn "1000" 类错误。

以下是完整、可运行的 PHP 示例代码（含类型转换与注释优化）：

PatentPal专利申请写作

AI软件来为专利申请自动生成内容

下载

<?php
$input = '[{"date":"2022-02-15","websites":[{"website_name":"instagram","num_followers":"123146780"},{"website_name":"instagram","num_followers":"123134954"},{"website_name":"tiktok","num_followers":"123184229"}]},{"date":"2022-02-14","websites":[{"website_name":"instagram","num_followers":"123057832"},{"website_name":"tiktok","num_followers":"123058141"},{"website_name":"tiktok","num_followers":"123058219"},{"website_name":"instagram","num_followers":"123059280"}]}]';

$data = [];
$decoded = json_decode($input, true);

foreach ($decoded as $day) {
    $sites = []; // 以 website_name 为键的临时映射表

    foreach ($day['websites'] as $site) {
        $name = $site['website_name'];
        $followers = (int)$site['num_followers']; // ✅ 关键：强制转为整型，确保数值比较准确

        // 若该网站名首次出现，或当前粉丝数更大，则更新
        if (!isset($sites[$name]) || $followers > (int)$sites[$name]['num_followers']) {
            $sites[$name] = $site;
        }
    }

    // 将关联数组重置为索引数组，保持输出格式一致
    $data[] = [
        'date' => $day['date'],
        'websites' => array_values($sites)
    ];
}

// 输出标准化 JSON（缩进格式便于查看）
echo json_encode($data, JSON_PRETTY_PRINT | JSON_UNESCAPED_UNICODE);
?>

注意事项与最佳实践：

? num_followers 字段若始终为纯数字字符串，(int) 转换安全；若可能含逗号或单位（如 "12.3M"），需先清洗再解析；
? 时间复杂度为 O(n)（n 为总网站对象数），空间复杂度 O(k)（k 为不重复网站名总数），高效适用于万级数据；
? 如需兼容 JavaScript 环境，可用 Array.reduce() + Map 实现类似逻辑，核心思想一致：用 Map 缓存各网站名对应的最大对象，遍历中动态更新；
? 最终结果严格满足要求：每个日期下每个网站名唯一，且 num_followers 为该日期该网站的最大值。

此方案简洁、可读性强，兼顾健壮性与性能，可直接集成至数据清洗管道中。

PHP框架模板怎么用_新手模板引擎加载与变量输出方法【指南】

宝塔面板如何配置PHP慢日志？在宝塔面板中查找运行效率低下的脚本

PHP 多维数组按多列分组并汇总指定字段值

PHP 多维数组按多列分组求和的完整实现方法

XAMPP 404 错误“Object not found”完整排查与修复指南

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：php代码示例怎样实现数据导入_php数据导入代码示例【示例】下一篇：php代码示例怎样实现搜索高亮_php搜索结果高亮代码示例【示例】

作者最新文章

SQLModel 中处理时区感知 datetime 字段的正确方法

2026-03-12 14:35

如何在保留首列字符串的前提下，用每行数值列均值填充 NaN

2026-03-12 14:35

如何让 Flex 布局的双栏页脚在移动端自动堆叠为单列

2026-03-12 14:47

鄂汇办app如何修改昵称

2026-03-12 14:49

海信发布E7S Pro终结取舍困境，玲珑真彩背光开启“原生色彩”时代

2026-03-12 15:02

如何在 MongoDB 中高效防止用户名和邮箱重复（推荐实践）

2026-03-12 15:05

如何在保留首列字符串的前提下，用每行数值列的均值填充 NaN

2026-03-12 15:40

vscode怎么还原隐藏的工具栏

2026-03-12 15:43

React应用中实现登录页与主页的双向路由保护

2026-03-12 15:43

高效求解轮盘弹跳路径：基于循环节检测的 O(n) 优化算法

2026-03-12 15:46

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

457

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

549

2023.08.23