0

0

如何计算相邻行的平均值(按分组标识符聚合)

花韻仙語

花韻仙語

发布时间:2026-01-13 11:47:14

|

828人浏览过

|

来源于php中文网

原创

如何计算相邻行的平均值(按分组标识符聚合)

本文介绍使用python对文本文件中具有相同前缀标识(如apple_1、apple_2)的连续行进行数值列聚合,按“_1”作为新组起始标志,自动计算每组内各数值列的算术平均值。

在处理结构化但非标准格式的日志或实验数据时,常遇到类似场景:多行记录共享同一逻辑实体名(如 apple_1, apple_2, apple_3),需将这些“相邻且同源”的行合并为一行统计结果——典型操作即计算各数值列的平均值。关键在于识别分组边界:本例中,以 _1 结尾的行(如 apple_1, book_1)标志着一个新组的开始,而其后连续出现的 _2, _3 等则属于该组,直到下一个 _1 出现为止。

以下是一个轻量、无外部依赖的纯 Python 实现:

def averages(lst, n):
    """生成器:对列表中每个元素除以 n,返回浮点平均值"""
    for v in lst:
        yield v / n

def dump(prev, cols, count):
    """输出当前组的聚合结果:前缀 + 各列平均值"""
    if prev:  # 避免首组前的空输出
        print(prev, *averages(cols, count))

# 主逻辑
with open("example.txt") as data:
    cols = []      # 存储当前组所有行对应列的累加和
    count = 0      # 当前组行数计数器
    prev = None    # 当前组的公共前缀(如 'apple')

    for line in data:
        parts = line.split()
        if not parts:  # 跳过空行
            continue
        key, *values = parts
        nums = list(map(float, values))  # 转为浮点数,支持小数输入

        # 拆分键名:'apple_1' → ('apple', '1')
        fruit, suffix = key.rsplit("_", 1)

        if suffix == "1":
            # 遇到新组起点:先输出上一组结果(若存在)
            dump(prev, cols, count)
            # 重置为新组
            prev = fruit
            cols = nums.copy()  # 初始化累加数组
            count = 1
        else:
            # 同组后续行:逐列累加
            for i, val in enumerate(nums):
                cols[i] += val
            count += 1

    # 文件结束,输出最后一组
    dump(prev, cols, count)

运行效果(输入示例文件):

飞象老师
飞象老师

猿辅导推出的AI教学辅助工具

下载
apple 2.0 3.0 4.0  
book 1.0 4.0 5.0  
cook 3.0 5.0 6.0  
book 2.0 3.0 4.0

注意事项:

  • 该算法严格依赖 _1 作为分组锚点,不依赖全局去重或字典索引,因此天然保持原始行序与分组顺序;
  • 所有数值列均强制转为 float,确保精度并兼容小数输入;
  • 若某组仅含一行(如独立的 book_1),其输出即为原值(等价于除以 1);
  • 空行会被自动跳过,增强鲁棒性;
  • 如需整数输出,可在 print() 中对 *averages(...) 结果做 int(round(x)) 处理,但建议保留浮点以避免精度损失。

此方案简洁、高效、可读性强,适用于中等规模数据(百万行内),无需加载全部数据到内存,适合流式处理场景。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

17

2026.02.03

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

594

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

105

2025.10.23

mysql标识符无效错误怎么解决
mysql标识符无效错误怎么解决

mysql标识符无效错误的解决办法:1、检查标识符是否被其他表或数据库使用;2、检查标识符是否包含特殊字符;3、使用引号包裹标识符;4、使用反引号包裹标识符;5、检查MySQL的配置文件等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

206

2023.12.04

Python标识符有哪些
Python标识符有哪些

Python标识符有变量标识符、函数标识符、类标识符、模块标识符、下划线开头的标识符、双下划线开头、双下划线结尾的标识符、整型标识符、浮点型标识符等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

313

2024.02.23

java标识符合集
java标识符合集

本专题整合了java标识符相关内容,想了解更多详细内容,请阅读下面的文章。

290

2025.06.11

c++标识符介绍
c++标识符介绍

本专题整合了c++标识符相关内容,阅读专题下面的文章了解更多详细内容。

174

2025.08.07

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

4

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号