如何计算相邻行的平均值（按分组标识符聚合）

花韻仙語

发布时间：2026-01-13 11:47:14

828人浏览过

来源于php中文网

原创

如何计算相邻行的平均值（按分组标识符聚合）

本文介绍使用python对文本文件中具有相同前缀标识（如apple_1、apple_2）的连续行进行数值列聚合，按“_1”作为新组起始标志，自动计算每组内各数值列的算术平均值。

在处理结构化但非标准格式的日志或实验数据时，常遇到类似场景：多行记录共享同一逻辑实体名（如 apple_1, apple_2, apple_3），需将这些“相邻且同源”的行合并为一行统计结果——典型操作即计算各数值列的平均值。关键在于识别分组边界：本例中，以 _1 结尾的行（如 apple_1, book_1）标志着一个新组的开始，而其后连续出现的 _2, _3 等则属于该组，直到下一个 _1 出现为止。

以下是一个轻量、无外部依赖的纯 Python 实现：

def averages(lst, n):
    """生成器：对列表中每个元素除以 n，返回浮点平均值"""
    for v in lst:
        yield v / n

def dump(prev, cols, count):
    """输出当前组的聚合结果：前缀 + 各列平均值"""
    if prev:  # 避免首组前的空输出
        print(prev, *averages(cols, count))

# 主逻辑
with open("example.txt") as data:
    cols = []      # 存储当前组所有行对应列的累加和
    count = 0      # 当前组行数计数器
    prev = None    # 当前组的公共前缀（如 'apple'）

    for line in data:
        parts = line.split()
        if not parts:  # 跳过空行
            continue
        key, *values = parts
        nums = list(map(float, values))  # 转为浮点数，支持小数输入

        # 拆分键名：'apple_1' → ('apple', '1')
        fruit, suffix = key.rsplit("_", 1)

        if suffix == "1":
            # 遇到新组起点：先输出上一组结果（若存在）
            dump(prev, cols, count)
            # 重置为新组
            prev = fruit
            cols = nums.copy()  # 初始化累加数组
            count = 1
        else:
            # 同组后续行：逐列累加
            for i, val in enumerate(nums):
                cols[i] += val
            count += 1

    # 文件结束，输出最后一组
    dump(prev, cols, count)

运行效果（输入示例文件）：

飞象老师

猿辅导推出的AI教学辅助工具

下载

apple 2.0 3.0 4.0  
book 1.0 4.0 5.0  
cook 3.0 5.0 6.0  
book 2.0 3.0 4.0

✅ 注意事项：

该算法严格依赖 _1 作为分组锚点，不依赖全局去重或字典索引，因此天然保持原始行序与分组顺序；
所有数值列均强制转为 float，确保精度并兼容小数输入；
若某组仅含一行（如独立的 book_1），其输出即为原值（等价于除以 1）；
空行会被自动跳过，增强鲁棒性；
如需整数输出，可在 print() 中对 *averages(...) 结果做 int(round(x)) 处理，但建议保留浮点以避免精度损失。

此方案简洁、高效、可读性强，适用于中等规模数据（百万行内），无需加载全部数据到内存，适合流式处理场景。

Python 装饰器实现原理及面试回答模板

为什么 macOS 上同时存在多个 Python 版本？

Python函数注解实践_类型提示落地方案

Python异步任务取消机制_async任务取消解析

为什么 macOS 上会同时存在多个 Python 版本？

相关标签:

python app apple print Float 标识符 int 算法

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在 Spark 中从指定路径读取已保存的表下一篇：如何使用正则表达式在 Pandas 中精准删除特定字符前的分隔符（如竖线 |）

作者最新文章

Go 中赋值操作为何必须使用等号：理解通道操作与表达式设计的底层逻辑

2026-03-03 15:59

高效统计用户指定时间窗口内的登录次数：数据结构选型与时间复杂度分析

2026-03-03 16:29

jQuery移动端下拉菜单自动关闭其他子菜单的实现方法

2026-03-03 16:30

如何在 Python 中正确结合抽象工厂模式与委托模式避免递归错误

2026-03-03 16:37

《星之卡比：飞天骑士》开发秘闻作曲家创作时根本不知什么游戏

2026-03-03 16:47

Node.js 中正确使用 mkdir 创建目录及文件的完整教程

2026-03-03 16:55

Spring Data JPA 多表关联投影：避免笛卡尔积与重复数据的正确实践

2026-03-03 16:58

如何在线性时间复杂度内高效定位有序数组中唯一的缺失整数（支持重复元素）

2026-03-03 16:59

Python curses Textbox 保留空行的正确配置方法

2026-03-03 17:44

网易大神如何屏蔽好友

2026-03-03 17:56

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容，供大家免费下载体验。

192

2023.09.27

python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容，阅读专题下面的文章了解更多详细教程。

2026.02.03

css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列，用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容，可以阅读本专题下面的文章。

594

2024.04.28

C++中int、float和double的区别

本专题整合了c++中int和double的区别，阅读专题下面的文章了解更多详细内容。

105

2025.10.23

mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法：1、检查标识符是否被其他表或数据库使用；2、检查标识符是否包含特殊字符；3、使用引号包裹标识符；4、使用反引号包裹标识符；5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

206

2023.12.04

Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

313

2024.02.23

java标识符合集

本专题整合了java标识符相关内容，想了解更多详细内容，请阅读下面的文章。

290

2025.06.11

c++标识符介绍

本专题整合了c++标识符相关内容，阅读专题下面的文章了解更多详细内容。

174

2025.08.07

PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开，重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景，深入分析性能瓶颈定位与优化思路，帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

2026.03.04

热门下载

网站特效

网站源码

网站素材

前端模板