如何在 NumPy 数组中定位并删除包含特定字符串的列

聖光之護

发布时间：2026-02-23 08:39:11

618人浏览过

来源于php中文网

原创

如何在 NumPy 数组中定位并删除包含特定字符串的列

本文介绍如何高效检测 numpy 二维数组中哪一列包含指定字符串，并通过布尔索引动态剔除该列，实现列级数据清洗。方法简洁、向量化、无需循环，适用于结构化文本型数组。

本文介绍如何高效检测 numpy 二维数组中哪一列包含指定字符串，并通过布尔索引动态剔除该列，实现列级数据清洗。方法简洁、向量化、无需循环，适用于结构化文本型数组。

在处理 NumPy 中的字符串二维数组（如 dtype='

import numpy as np

contacts = np.array([
    ["Apples", "Burger"],
    ["Bananas", "Cake"],
    ["Grapes", "Honey"]
])

目标是：找出包含字符串 "Bananas" 的列（即第 0 列），并将其整列移除，最终保留仅含 "Burger", "Cake", "Honey" 的单列数组。

关键在于——我们不关心 "Bananas" 出现在哪一行，而是要识别它所在的列索引，然后反选其余列。

✅ 核心思路：列级存在性判断 + 布尔掩码列筛选

NumPy 不支持直接对列做 in 检查，但可利用广播与聚合：

Amazon Nova

亚马逊云科技（AWS）推出的一系列生成式AI基础模型

下载

(contacts == 'Bananas') 生成一个形状相同的布尔数组；
.sum(0) 沿 axis=0（即按行求和）统计每列中 'Bananas' 出现的次数；
== 0 将其转为布尔掩码：True 表示该列不含 'Bananas'；
最后用 contacts[:, mask] 索引保留所有“安全列”。

完整代码如下：

mask = (contacts == 'Bananas').sum(axis=0) == 0
result = contacts[:, mask]

print(result)
# 输出：
# [['Burger']
#  ['Cake']
#  ['Honey']]

? 提示：axis=0 表示沿垂直方向（即跨行）求和，因此 sum(0) 得到的是长度为 contacts.shape[1] 的一维数组，每个元素对应一列的匹配总数。

⚠️ 注意事项

严格匹配：== 是全等比较，区分大小写且要求完全一致（如 'banana' 或 'Bananas ' 不会匹配）；
多匹配场景：若多个列均含目标字符串，该方法会一次性剔除所有匹配列；如只需删首个匹配列，需改用 np.argmax((contacts == 'Bananas').any(axis=0)) 定位列索引再构造掩码；
空值/非字符串类型：本方案假设数组为纯字符串类型（dtype='
性能优势：全程使用向量化操作，避免 Python 循环，在大数据量下显著快于 for + any()。

✅ 扩展：封装为可复用函数

def drop_columns_containing(arr, target):
    """
    删除 NumPy 2D 数组中任意位置包含 target 字符串的列。

    Parameters:
    -----------
    arr : np.ndarray, 2D
        输入字符串数组
    target : str
        要匹配的目标字符串

    Returns:
    --------
    np.ndarray
        删除匹配列后的新数组
    """
    if arr.ndim != 2:
        raise ValueError("Input must be a 2D array")
    mask = (arr == target).sum(axis=0) == 0
    return arr[:, mask]

# 使用示例
result = drop_columns_containing(contacts, 'Bananas')

此方法简洁、健壮、符合 NumPy 惯用范式，是处理标签化字符串矩阵列过滤的推荐实践。

相关标签:

numpy for 封装字符串循环字符串类型

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python GitHub Actions 的矩阵测试策略下一篇：暂无

作者最新文章

如何防止 Android 应用启动时自动崩溃

2026-02-20 09:43

Go 中结构体未导出字段的初始化问题解析

2026-02-20 09:43

Go 中如何在不同包中调用结构体的导出方法

2026-02-20 09:58

Go 中结构体字段未导出导致的隐式赋值错误解决方案

2026-02-20 10:23

使用 CSS Grid 精准控制表单背景图缩放与布局隔离

2026-02-20 10:36

解决路由器跨接口组播转发失败问题：原因分析与绕过方案

2026-02-20 10:37

解决路由器跨接口组播转发失败问题：从代码排查到地址适配的完整指南

2026-02-20 10:38

Golang Echo 框架中正确处理 HTTP 请求返回值的完整指南

2026-02-20 10:44

高效控制线程池批量拉取 API 分块数据（动态终止无用任务）

2026-02-20 10:49

如何防止 Android 应用启动时自动崩溃？

2026-02-20 10:50

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

616

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

217

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1558

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

642

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1006

2024.03.22