如何在 Pandas 中高效实现按行布尔聚合（any/or 操作）

心靈之曲

发布时间：2026-02-15 10:48:22

932人浏览过

来源于php中文网

原创

如何在 Pandas 中高效实现按行布尔聚合（any/or 操作）

本文介绍如何使用 DataFrame.any(axis=1) 对指定列执行高效的按行布尔“或”运算，生成新布尔列，避免低效的 Python 循环，充分发挥 pandas 向量化优势。

本文介绍如何使用 `dataframe.any(axis=1)` 对指定列执行高效的按行布尔“或”运算，生成新布尔列，避免低效的 python 循环，充分发挥 pandas 向量化优势。

在 Pandas 数据分析中，常需基于多列布尔值构造新的逻辑列——例如：“只要 a、b、c 中任一列为 True，则新列 d 为 True”。这一需求本质是按行（row-wise）的逻辑“或”聚合，关键在于必须沿 axis=1（即横向）计算，而非默认的 axis=0（纵向，即对整列求值）。

直接调用 df.any() 会返回每列是否含至少一个 True 的 Series（axis=0），这与目标不符；而 df.any(axis=1) 则对每一行的所有参与列执行 any()，返回长度等于行数的布尔 Series，完美匹配需求。

✅ 正确用法如下：

Clips AI

自动将长视频或音频内容转换为社交媒体短片

下载

import pandas as pd

# 构造示例数据
df = pd.DataFrame({
    'a': [True,  False, False],
    'b': [False, True,  False],
    'c': [True,  False, False]
})

# 方案1：对全部布尔列执行按行 any
df['d'] = df.any(axis=1)

# 方案2（推荐）：显式指定列，更安全、可读性更强
df['d'] = df[['a', 'b', 'c']].any(axis=1)

print(df)

输出：

      a      b      c      d
0  True  False   True   True
1 False   True  False   True
2 False  False  False  False

⚠️ 注意事项：

axis=1 是核心参数，不可省略；遗漏将导致按列聚合，结果完全错误；
若 DataFrame 包含非布尔列（如数值、字符串），any() 会隐式转换（如 0 → False, 非零数值/非空字符串 → True），建议显式限定列范围（如 df[['a','b','c']]）以避免意外行为；
该操作全程向量化，时间复杂度为 O(n×m)，远优于 apply(lambda row: row[['a','b','c']].any(), axis=1) 或显式 for 循环，尤其在万行级以上数据中性能优势显著。

? 扩展提示：类似地，df[['a','b','c']].all(axis=1) 可实现“全为 True 才为 True”的按行逻辑“与”运算；若需混合逻辑（如 (a & b) | c），推荐使用布尔运算符直接向量化表达：df['d'] = (df['a'] & df['b']) | df['c']，同样高效且语义清晰。

相关标签:

pandas 运算符 for 字符串循环 Lambda 数据分析

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何正确将动态追加的数据保存到 CSV 文件中下一篇：如何使用 Python 向现有 XML 文件追加数据

作者最新文章

如何用html写一个手机号码

2026-02-13 16:59

Drupal 9 模块 YAML 配置安装失败：依赖项未满足的解决方案

2026-02-13 17:07

Go语言中使用mgo驱动连接MongoDB时的EOF错误解决方案

2026-02-13 17:08

js如何往html文本框中写入初始值