如何在 Pandas 中基于分组重编号子组位置为连续的“location”序号

霞舞

发布时间：2026-02-06 23:49:49

287人浏览过

来源于php中文网

原创

如何在 Pandas 中基于分组重编号子组位置为连续的“location”序号

本文介绍如何对多级索引（如 `place_id` 和 `position_id`）数据，按每个 `place_id` 独立地将 `position_id` 映射为从 1 开始的连续整数 `location`，实现每组内位置的标准化重编号。

在实际数据分析中，原始 position_id 往往是全局唯一但不连续（例如 place 1 对应 1–4，place 2 对应 6–9），而业务需求常需将其转换为每组内从 1 开始的局部序号（即 location）。这种操作本质是按 place_id 分组后，对 position_id 进行组内排序并赋予秩次（rank）或顺序编号（cumcount），而非依赖硬编码的偏移量（如 position - 5），后者难以泛化且易出错。

✅ 推荐做法：使用 groupby().cumcount() + 1
这是最简洁、可扩展、健壮的方案：

# 假设 filterd_df 是你已有的 Series，索引为 MultiIndex (place_id, position_id)
# 先将其转为 DataFrame 便于操作（若仍为 Series）
df_reset = filterd_df.reset_index(name='count')

# 按 place_id 分组，对 position_id 组内升序排序后编号（从 0 开始 → +1 得到 location）
df_reset['location'] = (
    df_reset.sort_values(['place_id', 'position_id'])
            .groupby('place_id')
            .cumcount() + 1
)

print(df_reset[['place_id', 'position_id', 'count', 'location']])

输出示例：

   place_id  position_id  count  location
0       1            1   1234         1
1       1            2   7000         2
2       1            3   8000         3
3       1            4  10000         4
4       2            6   4111         1
5       2            7   9875         2
6       2            8   9900         3
7       2            9   1000         4

? 关键说明：

Talefy

一个AI故事创作和角色扮演平台

下载

sort_values(['place_id', 'position_id']) 确保每组内 position_id 按逻辑顺序排列（即使原始数据乱序也可靠）；
groupby('place_id').cumcount() + 1 为每组生成从 1 开始的连续整数，完全脱离具体数值映射规则；
此方法天然支持任意数量的 place_id 和任意 position_id 取值（如含缺失、跳变、负数等），无需手动编写 if/elif 分支。

⚠️ 注意事项：

若你的 filterd_df 是 Series（带 MultiIndex），务必先用 .reset_index() 转为 DataFrame 再操作，否则 apply 或 cumcount 在 Series 上行为受限；
避免使用 apply + 自定义函数（如原答案中的 map_position_to_location），它效率低、不可扩展，且当 place_id 增加时需反复修改逻辑；
如需保留原始 MultiIndex 结构，最后可用 set_index(['place_id', 'position_id']) 恢复。

总结：用 sort_values + groupby().cumcount() + 1 实现组内位置标准化，是 Pandas 中处理此类“子组重编号”任务的标准、高效、可维护解法。

Django模板中动态插入Google Maps嵌入链接失败的原因与解决方案

Python 解释器优化做了哪些事情

Python 流式处理网络数据的正确方式

Python .pyc 文件的生成与失效机制

FastAPI本地部署时连接被拒绝的解决方案

相关标签:

编码 app 排列 elif pandas if location position 数据分析

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：python如何截取字符串_三种核心方法（切片/find/正则）实战指南下一篇：暂无

作者最新文章

Chart.js 散点图中实现数据点颜色按 Y 值动态着色

2026-02-06 12:55

业界分析任天堂新发布会传达从复古到3A游戏全揽于旗下野心

2026-02-06 12:57

国产操作系统的崛起：盘点2024年值得关注的国产操作系统

2026-02-06 12:57

如何通过对比新旧数组识别被拖拽移动的元素

2026-02-06 13:16

《最终幻想7》重制版导演：今年将更积极公布游戏开发情报

2026-02-06 14:31

以阵破局，妙算神机！《枪火重生》第七赛季“妙阵天工”正式上线，本体迎来史低特惠！

2026-02-06 14:33

又吃上大份了育碧官方《荣耀战魂》"苦命鸳鸯"整活视频

2026-02-06 14:41

国产化麒麟信安操作系统激活方法

2026-02-06 14:51

恐怖打字游戏《Dyping Escape：生死敲定》2月6日Steam发布免费体验

2026-02-06 15:06

《噬血代码2》登顶Fami通销量榜！超越《马里奥赛车：世界》

2026-02-06 15:25

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

Python 数据清洗与预处理实战

本专题系统讲解 Python 在数据清洗与预处理中的核心技术，包括使用 Pandas 进行缺失值处理、异常值检测、数据格式化、特征工程与数据转换，结合 NumPy 高效处理大规模数据。通过实战案例，帮助学习者掌握如何处理混乱、不完整数据，为后续数据分析与机器学习模型训练打下坚实基础。

2026.01.31

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

797

2023.08.22

location.assign

在前端开发中，我们经常需要使用JavaScript来控制页面的跳转和数据的传递。location.assign就是JavaScript中常用的一个跳转方法。通过location.assign，我们可以在当前窗口或者iframe中加载一个新的URL地址，并且可以保存旧页面的历史记录。php中文网为大家带来了location.assign的相关知识、以及相关文章等内容，供大家免费下载使用。

227

2023.06.27