0

0

如何计算相邻行的平均值(按前缀分组)

花韻仙語

花韻仙語

发布时间:2026-01-13 11:14:24

|

214人浏览过

|

来源于php中文网

原创

如何计算相邻行的平均值(按前缀分组)

本文介绍如何使用纯 python 读取文本文件,按首列键名前缀(如 apple_1、apple_2)自动识别逻辑组,并对每组内所有相邻行(以 `_1` 为组起始标志)的数值列求平均值,最终输出简洁汇总结果。

在处理结构化但非标准的文本数据时(例如实验记录、日志摘要或批量采集结果),常需对“逻辑连续行”进行聚合——而非简单按固定行数分组。本例中,数据以 xxx_1、xxx_2、xxx_3 等形式隐式定义组边界:每个 _1 表示新组开始,其后连续的同前缀行(如 apple_2、apple_3)属于同一组;组内所有数值列(第2–4列)需逐列求平均,前缀(如 apple)作为输出标识。

以下为完整可运行解决方案(无需 Pandas 或 NumPy,仅依赖内置模块):

def averages(lst, n):
    """生成器:对列表中每个元素除以 n,返回浮点平均值"""
    for v in lst:
        yield v / n

def dump(prev, cols, count):
    """输出当前组结果:前缀 + 各列平均值(保留小数)"""
    if prev:
        print(prev, *averages(cols, count))

# 主逻辑:逐行解析,动态累积并触发输出
with open("example.txt") as data:
    cols = []      # 存储当前组所有数值列的累加和(长度=列数)
    count = 0      # 当前组已处理行数
    prev = None    # 当前组前缀(如 'apple')

    for line in data:
        line = line.strip()
        if not line:  # 跳过空行
            continue
        parts = line.split()
        key, *values = parts
        nums = list(map(float, values))  # 强制转 float,支持小数输入

        # 拆分键:apple_2 → ('apple', '2')
        fruit, suffix = key.rsplit("_", 1)

        if suffix == "1":
            # 遇到新组起点:先输出上一组结果(如有),再重置状态
            dump(prev, cols, count)
            prev = fruit
            cols = nums.copy()  # 初始化新组累加数组
            count = 1
        else:
            # 同组后续行:逐列累加
            for i in range(len(nums)):
                cols[i] += nums[i]
            count += 1

    # 文件结束,输出最后一组
    dump(prev, cols, count)

关键设计说明:

WPS灵犀
WPS灵犀

WPS灵犀是WPS推出的一款AI智能办公和学习助手

下载
  • 组识别机制:严格以 _1 作为组起始信号(如 book_1、cook_1),确保逻辑清晰、无歧义;
  • 内存友好:不加载全部数据到内存,适合大文件流式处理;
  • 类型安全:使用 float() 转换,兼容整数与小数输入;
  • ⚠️ 注意事项
    • 输入文件需保证每行至少含 2 列(键 + 一个数值),否则 rsplit("_", 1) 或 map(float, values) 可能报错,建议增加异常处理(如 try/except ValueError);
    • 若存在 xxx_0 或非数字后缀(如 xxx_a),需扩展 suffix == "1" 的判断逻辑;
    • 输出为标准浮点格式(如 2.0),如需控制小数位数,可在 print 中使用格式化:f"{v:.1f}"。

运行后,输入示例将精准输出:

apple 2.0 3.0 4.0
book 1.0 4.0 5.0
cook 3.0 5.0 6.0
book 2.0 3.0 4.0

该方案兼顾可读性、健壮性与低依赖性,是处理此类“隐式分组+行间聚合”任务的典型 Python 实践。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 时间序列分析与预测
Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧,涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估,以及基于实际业务场景的时间序列项目实操,帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

76

2025.12.04

Python 数据清洗与预处理实战
Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术,包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换,结合 NumPy 高效处理大规模数据。通过实战案例,帮助学习者掌握 如何处理混乱、不完整数据,为后续数据分析与机器学习模型训练打下坚实基础。

12

2026.01.31

python中print函数的用法
python中print函数的用法

python中print函数的语法是“print(value1, value2, ..., sep=' ', end=' ', file=sys.stdout, flush=False)”。本专题为大家提供print相关的文章、下载、课程内容,供大家免费下载体验。

192

2023.09.27

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

17

2026.02.03

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

593

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

105

2025.10.23

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

77

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

39

2025.11.16

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

0

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 4.7万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号