Python中对NumPy数组内字典进行按值降序排序的实用教程

花韻仙語

发布时间：2025-09-28 10:24:16

532人浏览过

来源于php中文网

原创

Python中对NumPy数组内字典进行按值降序排序的实用教程

本教程旨在解决如何对存储在NumPy数组中的字典进行按值降序排序的问题。通过详细步骤和代码示例，我们将学习如何从NumPy数组中提取字典、使用sorted()函数结合lambda表达式按字典值进行排序，并最终重构一个有序字典，这对于从数据中提取如“伤亡人数最多的城市”等关键信息至关重要。

1. 问题背景与数据结构

在数据处理过程中，我们经常会将统计结果聚合到一个字典中，例如统计各个城市的总伤亡人数。有时，这个字典可能会被意外或有意地封装在一个numpy数组中。例如，在处理csv文件后，我们可能得到一个城市伤亡人数的字典，如下所示：

import csv
import numpy as np

city_dict = {'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603, 'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1, 'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7, 'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3, 'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768, 'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2, 'Qadian': 7, 'Baloda Bazar': 10}

# 将字典放入NumPy数组
np_city = np.array(city_dict)
print("原始NumPy数组内容：")
print(np_city)
print("NumPy数组类型：", type(np_city))
print("NumPy数组元素类型：", np_city.dtype)

运行上述代码，你会发现np_city实际上是一个包含单个字典对象的NumPy数组，其dtype为object。这意味着NumPy并没有将字典的键值对进行向量化处理，而是将整个字典作为一个元素存储。

原始NumPy数组内容：
{'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603, 'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1, 'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7, 'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3, 'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768, 'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2, 'Qadian': 7, 'Baloda Bazar': 10}
NumPy数组类型： 
NumPy数组元素类型： object

我们的目标是根据字典的值（例如，总伤亡人数）对这个字典进行降序排序，以便快速找出伤亡最多的城市。

2. 从NumPy数组中提取字典

由于np_city是一个只包含一个元素的NumPy数组（这个元素就是我们的字典），我们需要使用item()方法来提取这个字典对象。

# 提取NumPy数组中的字典
extracted_dict = np_city.item()
print("\n提取出的字典类型：", type(extracted_dict))
print("提取出的字典内容：", extracted_dict)

item()方法会返回数组中的唯一元素。如果数组包含多个元素，调用item()会引发ValueError。

立即学习“Python免费学习笔记（深入）”；

3. 对字典进行按值降序排序

一旦我们获得了原始字典，就可以使用Python内置的sorted()函数结合lambda表达式对其进行排序。

sorted()函数可以接受一个可迭代对象（如字典的items()视图）和一个key参数，key参数是一个函数，用于从每个元素中提取一个比较键。

Faceswap

免费开源的AI换脸工具

下载

extracted_dict.items(): 这会返回一个包含字典所有键值对的视图对象，形式为(key, value)元组的列表。
key=lambda item: item[1]: 这里的lambda函数定义了一个匿名函数，它接受一个item（即一个(key, value)元组），并返回item[1]（即元组的第二个元素，也就是字典的值）。sorted()函数将根据这个返回值进行排序。
reverse=True: 这个参数指示sorted()函数进行降序排序。

# 对字典的items进行排序
sorted_items = sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)
print("\n排序后的键值对列表：")
print(sorted_items)

sorted_items现在是一个按值降序排列的(key, value)元组列表。

4. 重构为有序字典

Python 3.7+ 版本保证了字典会保留插入顺序。因此，我们可以使用字典推导式（Dictionary Comprehension）将排序后的元组列表转换回一个有序字典。

# 使用字典推导式重构为有序字典
sorted_city_dict = {key: value for key, value in sorted_items}
print("\n最终按伤亡人数降序排列的城市字典：")
print(sorted_city_dict)

最终输出的sorted_city_dict将是一个按照城市伤亡人数从高到低排列的字典。

最终按伤亡人数降序排列的城市字典：
{'New Delhi': 2095, 'Guwahati': 822, 'Amritsar': 768, 'Imphal': 603, 'Chennai': 366, 'Chandigarh': 333, 'Bombay': 210, 'Gauhati': 112, 'Calcutta': 57, 'Jamshedpur': 32, 'Baloda Bazar': 10, 'Tindol': 7, 'Qadian': 7, 'Tirupattur': 6, 'Tipaimukh': 6, 'Samastipur': 4, 'Jorhat': 3, 'Aizawl': 2, 'Amapur': 2, 'Jodhpur': 2, 'Mothan Wala': 2, 'Raisikah': 1, 'Champhai': 1, 'Chiaplant': 1, 'Massad': 1, 'Harchowal': 1}

5. 完整代码示例

下面是结合了数据读取、处理和排序的完整代码示例（假设terrorismData.csv文件存在且格式正确）：

import csv
import numpy as np

def get_top_cities_by_casualties(csv_file_path, country='India', top_n=5):
    """
    从CSV文件中读取数据，计算指定国家各城市的总伤亡人数，
    并返回按伤亡人数降序排列的前N个城市。

    Args:
        csv_file_path (str): CSV文件路径。
        country (str): 要筛选的国家名称。
        top_n (int): 要返回的前N个城市。

    Returns:
        dict: 按伤亡人数降序排列的前N个城市字典。
    """
    city_casualties = {}
    try:
        with open(csv_file_path, 'r', encoding='utf-8') as file_obj:
            data_reader = csv.DictReader(file_obj, skipinitialspace=True)

            for row in data_reader:
                if row['Country'] == country:
                    # 处理空值并转换为整数
                    killed = int(float(row['Killed'])) if row['Killed'] else 0
                    wounded = int(float(row['Wounded'])) if row['Wounded'] else 0

                    total_casualty = killed + wounded
                    city = row['City']

                    if city and city != 'Unknown':            
                        city_casualties[city] = city_casualties.get(city, 0) + total_casualty
    except FileNotFoundError:
        print(f"错误: 文件 '{csv_file_path}' 未找到。")
        return {}
    except Exception as e:
        print(f"处理文件时发生错误: {e}")
        return {}

    # 将字典放入NumPy数组（虽然在此场景下并非最佳实践，但为了演示而保留）
    np_city_casualties = np.array(city_casualties)

    # 提取字典
    extracted_dict = np_city_casualties.item()

    # 对字典进行按值降序排序
    sorted_items = sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)

    # 重构为有序字典并获取前N个
    top_cities = {key: value for key, value in sorted_items[:top_n]}

    return top_cities

# 示例调用
csv_path = 'terrorismData.csv' # 替换为你的CSV文件路径
top_5_cities = get_top_cities_by_casualties(csv_path, top_n=5)
print(f"\n印度伤亡人数最多的前5个城市：")
print(top_5_cities)

6. 注意事项与总结

NumPy数组封装字典的场景：将整个字典封装在NumPy数组中（如np.array(some_dict)）通常不是NumPy的最佳使用方式，因为它创建了一个dtype=object的数组，并没有利用NumPy的数值计算优势。如果需要处理结构化数据，pandas DataFrame或NumPy的结构化数组通常是更好的选择。
item()方法的限制：item()方法只能用于包含单个元素的NumPy数组。如果数组中有多个元素，你需要使用索引（例如np_array[0]）来访问特定元素。
Python字典的有序性：从Python 3.7+ 开始，字典会保留插入顺序。这意味着通过字典推导式从排序后的键值对列表重构的字典将保持排序后的顺序。
lambda函数：lambda函数提供了一种简洁的方式来定义小型匿名函数，非常适合作为sorted()等函数的key参数。
效率：对于中等大小的字典，这种排序方法是高效且易于理解的。

通过本教程，我们学习了如何处理NumPy数组中包含字典的特殊情况，并成功地对其进行了按值降序排序，从而能够轻松地从数据中提取出最有价值的信息。

如何实现一个支持负索引、切片、in 的自定义容器

Python set 去重的底层实现逻辑

Python with 语句的底层实现原理

Python 自定义对象作为 dict key 的注意事项

如何在 Python 数据类继承中为父类必需字段设置子类默认值

相关专题

Python 时间序列分析与预测

本专题专注讲解 Python 在时间序列数据处理与预测建模中的实战技巧，涵盖时间索引处理、周期性与趋势分解、平稳性检测、ARIMA/SARIMA 模型构建、预测误差评估，以及基于实际业务场景的时间序列项目实操，帮助学习者掌握从数据预处理到模型预测的完整时序分析能力。

2025.12.04

lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式，它可以在需要函数作为参数的地方使用，并提供了一种更简洁、更灵活的编码方式，其语法为“lambda 参数列表: 表达式”，参数列表是函数的参数，可以包含一个或多个参数，用逗号分隔，表达式是函数的执行体，用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容，供大家免费下载体验。

207

2023.09.15

python lambda函数

本专题整合了python lambda函数用法详解，阅读专题下面的文章了解更多详细内容。

191

2025.11.08

Python lambda详解

本专题整合了Python lambda函数相关教程，阅读下面的文章了解更多详细内容。

2026.01.05

treenode的用法

在计算机编程领域，TreeNode是一种常见的数据结构，通常用于构建树形结构。在不同的编程语言中，TreeNode可能有不同的实现方式和用法，通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

538

2023.12.01

C++ 高效算法与数据结构

本专题讲解 C++ 中常用算法与数据结构的实现与优化，涵盖排序算法（快速排序、归并排序）、查找算法、图算法、动态规划、贪心算法等，并结合实际案例分析如何选择最优算法来提高程序效率。通过深入理解数据结构（链表、树、堆、哈希表等），帮助开发者提升在复杂应用中的算法设计与性能优化能力。

2025.12.22

深入理解算法：高效算法与数据结构专题

本专题专注于算法与数据结构的核心概念，适合想深入理解并提升编程能力的开发者。专题内容包括常见数据结构的实现与应用，如数组、链表、栈、队列、哈希表、树、图等；以及高效的排序算法、搜索算法、动态规划等经典算法。通过详细的讲解与复杂度分析，帮助开发者不仅能熟练运用这些基础知识，还能在实际编程中优化性能，提高代码的执行效率。本专题适合准备面试的开发者，也适合希望提高算法思维的编程爱好者。

2026.01.06