可行方法包括:一、外部排序+双指针读取法;二、快速选择算法;三、分桶计数法;四、数据库辅助法;五、流式双堆法。

如果需要在 PHP 中计算超大数组的中位数,而该数组无法全部加载到内存中,或其元素数量达到千万级甚至更高,则直接使用 sort() 或 array_merge() 将导致内存溢出或性能严重下降。以下是几种可行的实现方法:
该方法适用于数组以文件形式存储(如每行一个数字),不依赖内存一次性加载全部数据,通过外部归并排序后,用两个指针定位中间位置。
1、将原始大数据分割为多个小块文件,每个块独立排序并写入临时文件。
2、对所有已排序的小块文件执行 k 路归并,生成一个全局有序的临时文件。
立即学习“PHP免费学习笔记(深入)”;
3、获取总元素个数 N,打开有序文件,使用 fseek 定位到第 (N-1)/2 和 N/2 行(针对奇偶长度)。
4、逐行读取至目标行,提取对应数值并计算中位数。
该算法基于快排分区思想,平均时间复杂度为 O(n),无需完全排序,仅需找到第 ⌊n/2⌋ 和 ⌈n/2⌉ 小的元素。
1、定义递归函数 quickselect($arr, $left, $right, $k),返回数组中第 k 小的值(k 从 0 开始)。
2、选取基准元素 pivot,将数组划分为小于、等于、大于 pivot 的三部分。
3、根据 k 所在区间决定递归方向:若 k 在小于区,则递归左半;若在等于区,直接返回 pivot;否则递归右半。
4、调用 quickselect 获取中位数位置对应值:奇数长度取 quickselect($arr, 0, $n-1, $n/2);偶数长度取两值平均。
当数组元素为整数且最大值与最小值之差可控(如在 -10^6 到 10^6 范围内),可避免比较排序,用空间换时间。
1、扫描原始数组一次,统计每个数值出现频次,存入关联数组 $count,键为数值,值为频次。
2、按数值升序遍历 $count,累加频次 sum,直到 sum ≥ (n+1)/2。
3、若 n 为奇数,当前键即为中位数;若 n 为偶数,需向前回溯找到前一个中位数位置并求平均。
利用数据库索引与 LIMIT/OFFSET 高效定位中间记录,规避 PHP 内存压力。
1、确保目标数值字段已建立 B+ 树索引。
2、执行 SQL 查询:SELECT value FROM table ORDER BY value LIMIT 1 OFFSET FLOOR((SELECT COUNT(*) FROM table)-1)/2。
3、若总数为偶数,再执行一次 OFFSET 减 1 的查询,取两次结果的平均值。
4、PHP 中仅处理两条记录,而非全量数据集。
适用于数据以流形式到达、无法预知总量,或需实时维护中位数的场景,使用最大堆存较小一半、最小堆存较大一半。
1、初始化两个 SplMaxHeap 和 SplMinHeap 实例,分别存储左半区和右半区。
2、每插入一个新数 x:若 x ≤ 左堆顶,入左堆;否则入右堆。
3、调整堆大小平衡:确保 |左堆大小 − 右堆大小| ≤ 1,必要时弹出并交换堆顶元素。
4、中位数由堆顶决定:奇数总数时取较大堆顶;偶数时取两堆顶平均值。
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号