如何在 NumPy 数组中正确添加新联系人（按列扩展结构化数据）

心靈之曲

发布时间：2026-02-16 11:12:24

330人浏览过

来源于php中文网

原创

如何在 NumPy 数组中正确添加新联系人（按列扩展结构化数据）

本文详解如何在以“字段为行、联系人为列”组织的二维 NumPy 数组中，安全高效地追加新联系人，重点解决因维度不匹配导致的 concatenate 报错问题，并提供可直接运行的修复方案。

本文详解如何在以“字段为行、联系人为列”组织的二维 numpy 数组中，安全高效地追加新联系人，重点解决因维度不匹配导致的 `concatenate` 报错问题，并提供可直接运行的修复方案。

在 NumPy 中处理结构化表格数据时，一个常见但易被忽视的设计选择是：将字段（如姓名、姓氏、邮箱）作为行，而将每个联系人作为列。您当前的 data 数组正是这种布局：

import numpy as np

data = np.array([
    ["Leon", "John", "Petar"],  # Names (row 0)
    ["Smith", "Jones", "Taylor"],  # Surnames (row 1)
    ["<a class=\"__cf_email__\" ...>[email&#8203;protected]</a>", 
     "<a class=\"__cf_email__\" ...>[email&#8203;protected]</a>", 
     "<a class=\"__cf_email__\" ...>[email&#8203;protected]</a>"],  # Emails (row 2)
    ["maxefaxe11", "Mohrhuhn3000", "warpd_fungz"],  # Usernames (row 3)
    ["fakemake11", "ichliebehuhn1", "lollls123"]   # Passwords (row 4)
])

该数组形状为 (5, 3) —— 5 行（字段）、3 列（现有联系人）。当新增第 4 位联系人（Tom Walker 等）时，目标是将其各字段分别追加到对应行末尾，最终得到 (5, 4) 数组。

您原代码中的关键错误在于：

Eva Design System

基于深度学习的色彩生成器

下载

构造的 new_contact = np.array([[name, surname, email, username, password]]) 形状为 (1, 5)；
调用 np.concatenate((data, new_contact), axis=1) 试图沿列方向拼接，但 data 是 (5, 3)，new_contact 是 (1, 5)，第 0 维（行数）不一致（5 vs 1），故报 ValueError。

✅ 正确做法是：将新联系人的 5 个字段转置为列向量（即 (5, 1)），再沿 axis=1 拼接。这可通过 .T（或 np.transpose()）实现：

def register_contact():
    name = input("Enter name: ")
    surname = input("Enter surname: ")
    email = input("Enter email: ")
    username = input("Enter username: ")
    password = input("Enter password: ")

    # 构造新联系人：1行×5列 → 转置为5行×1列
    new_contact = np.array([[name, surname, email, username, password]]).T

    global data
    data = np.concatenate((data, new_contact), axis=1)  # ✅ shape: (5,3) + (5,1) → (5,4)

    print("Contact registered successfully.")

# 示例调用（输入 Tom / Walker / ... 后）
register_contact()
print(data.shape)  # 输出: (5, 4)
print(data[:, -1])  # 查看最新一列（新联系人所有字段）

? 重要注意事项：

避免频繁 concatenate：NumPy 数组是固定大小的；每次 concatenate 都会创建新数组并复制全部数据，对大量注册操作性能较差。生产环境建议改用 list 动态收集，最后一次性转为 np.array，或使用 pandas.DataFrame。
数据类型一致性：当前所有字段均为字符串，若后续需混合数值（如年龄），应显式指定 dtype=object 或统一转换为字符串，否则 np.array 可能静默截断。
安全性提醒：示例中邮箱含 HTML 标签（反爬保护），实际应用中应先解析真实邮箱（如提取 data-cfemail 属性并解码），或从源头使用纯文本邮箱。

总结：向此类“字段-行/记录-列”的 NumPy 数组添加新记录，核心是确保新数据维度与目标轴对齐——通过 .T 实现字段对齐，而非按记录原始顺序拼接。理解数据的逻辑布局，比记忆函数用法更重要。

相关标签:

numpy pandas 数据类型 Array Object 字符串

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何解析 Python 的 .pth 文件：路径添加与内联代码的精确区分规则下一篇：PyTorch 高级索引：使用嵌套索引列表对二维张量进行高效批量赋值

作者最新文章

Java中正则表达式匹配的正确用法详解

2026-02-16 15:35

Java 中正确解析 PEM 格式 PKCS#8 私钥的完整教程

2026-02-16 16:08

如何让按钮在 Flex 容器中精准缩放至 30px 宽度

2026-02-16 16:10