深入理解直接访问数组排序：原理与实现

碧海醫心

发布时间：2025-11-19 14:33:47

831人浏览过

来源于php中文网

原创

深入理解直接访问数组排序：原理与实现

直接访问数组排序是一种利用数据项的键值作为数组索引来对数据进行排序的算法。它适用于具有唯一、非负整数键的场景，通过构建一个足够大的直接访问数组来存储完整的对象，然后按键的自然顺序遍历该数组，从而高效地重建一个有序的数据序列。本文将详细解析其工作原理、实现步骤，并通过示例代码阐明其如何实现对完整对象的排序，并探讨其适用场景与局限性。

直接访问数组排序原理

直接访问数组排序（Direct Access Array Sort）的核心思想是利用数据项的键（key）作为数组的索引。当所有数据项的键都是唯一且非负的整数时，我们可以创建一个足够大的辅助数组（即直接访问数组），其大小能够覆盖所有可能的键值范围。然后，将每个数据项直接放置到辅助数组中对应其键的索引位置上。由于数组索引的自然有序性，当遍历辅助数组时，我们就能按键的升序依次取出数据项，从而实现对原始数据项的排序。

这种方法之所以能对“值”进行排序，是因为它存储在辅助数组中的是完整的“数据项”（通常是包含键和值的对象），而不仅仅是键本身。键的作用是确定数据项在辅助数组中的位置，而一旦数据项被放置到位，它就带着其所有属性（包括值）一同被“排序”了。

算法实现步骤

直接访问数组排序算法通常包含以下四个主要步骤：

1. 确定键值范围

首先，需要遍历输入数组 A，找出所有数据项中的最大键值。这个最大键值将决定直接访问数组 D 的大小 u（通常是最大键值 + 1）。这一步的时间复杂度为 O(n)，其中 n 是输入数组 A 的长度。

2. 构建直接访问数组

创建一个新的辅助数组 D，其大小为 u，并用一个占位符（如 None）初始化所有位置。这个数组 D 就是我们所说的“直接访问数组”。这一步的空间复杂度为 O(u)。

3. 插入数据项

遍历输入数组 A 中的每一个数据项 x。对于每个 x，将其完整地存储到直接访问数组 D 中，其位置由 x.key 决定，即 D[x.key] = x。这一步的时间复杂度为 O(n)。

4. 有序提取

初始化一个计数器 i = 0，用于跟踪原始数组 A 中下一个可插入的位置。然后，从索引 0 到 u-1 遍历直接访问数组 D。对于 D 中的每一个位置 key，如果 D[key] 不为 None（即该位置存储了一个实际的数据项），则将该数据项 D[key] 复制回原始数组 A 的 A[i] 位置，并递增 i。这一步的时间复杂度为 O(u)。

示例代码与详细解析

以下是直接访问数组排序的Python实现示例，我们将通过一个具体的例子来详细解析其工作流程。

Magic AI Avatars

神奇的AI头像，获得200多个由AI制作的自定义头像。

下载

class Item:
    """模拟一个包含键和值的通用数据项"""
    def __init__(self, key, value=None):
        self.key = key
        self.value = value if value is not None else f"data_{key}"

    def __repr__(self):
        return f"{{key: {self.key}, value: '{self.value}'}}"

def direct_access_sort(A):
    """
    直接访问数组排序算法
    假设数据项具有唯一且非负的整数键。
    """
    if not A:
        return A

    # 步骤一：确定键值范围
    # 查找输入数组A中所有项的最大键，并据此确定直接访问数组D的大小u。
    # O(n) 时间复杂度。
    max_key = 0
    for x in A:
        if x.key > max_key:
            max_key = x.key
    u = max_key + 1 # 直接访问数组的大小

    print(f"最大键值: {max_key}, 直接访问数组D的大小: {u}")

    # 步骤二：构建直接访问数组
    # 创建一个大小为u的数组D，并用None填充。
    # O(u) 空间复杂度。
    D = [None] * u
    print(f"初始化直接访问数组D (大小 {u}): {D}")

    # 步骤三：插入数据项
    # 遍历输入数组A中的每个数据项x，将其完整地放入D中以x.key为索引的位置。
    # O(n) 时间复杂度。
    print("\n--- 插入数据项到D ---")
    for x in A:
        D[x.key] = x
        print(f"插入 {x} 到 D[{x.key}]")
    print(f"插入后的D: {D}")

    # 步骤四：有序提取
    # 初始化一个计数器i，用于跟踪A中下一个可插入的位置。
    i = 0
    print("\n--- 从D有序提取数据项 ---")
    # 遍历直接访问数组D从索引0到u-1。
    # O(u) 时间复杂度。
    for key in range(u):
        # 检查当前索引key处是否有实际的数据项（即不是None）。
        if D[key] is not None:
            # 如果有数据项，将其按顺序放回原始数组A。
            A[i] = D[key]
            print(f"从 D[{key}] 提取 {D[key]} 到 A[{i}]")
            # 递增计数器，为下一个有序项准备。
            i += 1
    print(f"排序完成后的A: {A}")
    return A

# 示例数据：假设我们有一组人员，以身高（厘米）作为键进行排序
# 这里我们只关注key，value可以是一个占位符
input_data = [
    Item(key=160, value="Alice"),
    Item(key=150, value="Bob"),
    Item(key=200, value="Charlie"),
    Item(key=188, value="David")
]

print("原始输入数组 A:", input_data)
sorted_data = direct_access_sort(input_data)
print("最终排序结果 A:", sorted_data)

运行上述代码，我们将看到以下详细的执行过程：

原始输入数组 A: [{key: 160, value: 'Alice'}, {key: 150, value: 'Bob'}, {key: 200, value: 'Charlie'}, {key: 188, value: 'David'}]
步骤一：确定键值范围
- 遍历 A，找到最大键为 200。
- 因此，u = 200 + 1 = 201。直接访问数组 D 的大小将是 201。
步骤二：构建直接访问数组
- 创建一个包含 201 个 None 的数组 D。
- D = [None, None, ..., None] (共201个)
步骤三：插入数据项
- x = {key: 160, value: 'Alice'} -> D[160] = {key: 160, value: 'Alice'}
- x = {key: 150, value: 'Bob'} -> D[150] = {key: 150, value: 'Bob'}
- x = {key: 200, value: 'Charlie'} -> D[200] = {key: 200, value: 'Charlie'}
- x = {key: 188, value: 'David'} -> D[188] = {key: 188, value: 'David'}
- 此时，D 中只有 D[150], D[160], D[188], D[200] 存储了实际数据，其余位置仍为 None。
步骤四：有序提取
- i = 0
- 遍历 key 从 0 到 200：
  - 当 key = 150 时，D[150] 不为 None。将 {key: 150, value: 'Bob'} 赋给 A[0]。i 变为 1。
  - 当 key = 160 时，D[160] 不为 None。将 {key: 160, value: 'Alice'} 赋给 A[1]。i 变为 2。
  - 当 key = 188 时，D[188] 不为 None。将 {key: 188, value: 'David'} 赋给 A[2]。i 变为 3。
  - 当 key = 200 时，D[200] 不为 None。将 {key: 200, value: 'Charlie'} 赋给 A[3]。i 变为 4。
- 其他 key 值处 D[key] 均为 None，跳过。

最终排序结果 A: [{key: 150, value: 'Bob'}, {key: 160, value: 'Alice'}, {key: 188, value: 'David'}, {key: 200, value: 'Charlie'}]。可以看到，原始的复杂对象（包含键和值）已经根据键的顺序成功排序。

适用场景与注意事项

适用场景

键为唯一非负整数: 这是该算法最基本且严格的要求。如果键不唯一，则需要额外的处理（如链表存储冲突），这会使其退化为桶排序或哈希表。
键的范围相对较小: 当键的最大值 u 与数据项数量 n 相近时，直接访问数组排序的效率非常高。其时间复杂度为 O(n + u)，空间复杂度为 O(u)。在理想情况下（u ≈ n），它可以达到线性的 O(n) 时间复杂度。

注意事项与局限性

键的唯一性: 如果键不唯一，D[x.key] = x 操作会覆盖掉相同键的先前数据项，导致数据丢失。
键的非负性: 数组索引不能为负数。
键的整数性: 数组索引必须是整数。
空间效率: 当键的范围 u 远大于数据项的数量 n 时，会造成大量的空间浪费。例如，如果只有10个数据项，但它们的键值分布在0到1,000,000之间，那么 D 数组将需要1,000,001个位置，其中绝大部分是空的，这在内存上是不可接受的。
时间效率: 即使空间不是问题，当 u 远大于 n 时，最后一步的遍历 D 的操作也会变得非常耗时，导致 O(n+u) 的时间复杂度中的 u 部分占据主导，性能下降。
与计数排序/基数排序的联系: 直接访问数组排序可以看作是计数排序的一种简化形式，尤其是在键值本身就是我们需要排序的唯一属性时。它也是基数排序的基础之一，基数排序通过多次直接访问数组排序来处理多位数键。

总结

直接访问数组排序是一种简洁高效的排序算法，尤其适用于键值范围有限且键为唯一非负整数的特定场景。它通过将键作为直接索引，实现了对完整数据项的快速定位和有序重构。然而，其对键的严格要求以及在键值范围过大时可能导致的巨大空间和时间开销，限制了其普适性。理解其工作原理和局限性，有助于在合适的场景中选择并应用这一强大的排序技术。

Python asyncio.sleep怎么用_模拟异步非阻塞耗时操作切出控制权替代time.sleep()

Python多数元素怎么找_摩尔投票法O(1)空间寻找众数

Python爬虫重试机制怎么写_Tenacity库装饰器实现网络异常自动重试与退避策略

Python异步上下文管理器_async with使用与__aenter__及__aexit__魔法方法实现资源管理

Python断言怎么写_assert语句在代码调试与校验中的作用

相关专题

sort排序函数用法

sort排序函数的用法：1、对列表进行排序，默认情况下，sort函数按升序排序，因此最终输出的结果是按从小到大的顺序排列的；2、对元组进行排序，默认情况下，sort函数按元素的大小进行排序，因此最终输出的结果是按从小到大的顺序排列的；3、对字典进行排序，由于字典是无序的，因此排序后的结果仍然是原来的字典，使用一个lambda表达式作为key参数的值，用于指定排序的依据。

409

2023.09.04

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

497

2023.08.14

vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容，供大家免费下载体验。

329

2023.10.09

vb连接access数据库的方法

vb连接access数据库方法：1、使用ADO连接，首先导入System.Data.OleDb模块，然后定义一个连接字符串，接着创建一个OleDbConnection对象并使用Open() 方法打开连接；2、使用DAO连接，首先导入 Microsoft.Jet.OLEDB模块，然后定义一个连接字符串，接着创建一个JetConnection对象并使用Open()方法打开连接即可。

478

2023.10.16

asp连接access数据库的方法

连接的方法：1、使用ADO连接数据库；2、使用DSN连接数据库；3、使用连接字符串连接数据库。想了解更详细的asp连接access数据库的方法，可以阅读本专题下面的文章。

123

2023.10.18

access和trunk端口的区别

access和trunk端口的区别是Access端口用于连接终端设备，提供单个VLAN的接入，而Trunk端口用于连接交换机之间，提供多个VLAN的传输；Access端口只传输属于指定VLAN的数据，而Trunk端口可以传输多个VLAN的数据，并使用VLAN标签进行区分。想了解更多access和trunk端口相关内容，可以阅读本专题下面的文章。

337

2023.10.31

access怎么导入数据

access导入数据步骤：1. 选择数据源 2. 选择要导入的文件 3. 指定导入选项 4. 选择导入目标 5. 预览数据 6. 导入数据即可。想了解更多access的相关内容，可以阅读本专题下面的文章。

459

2024.04.10

access数据库用途

access数据库是一种关系型数据库管理系统，主要用途包括：数据存储和管理；数据查询和检索；报告和表单设计；应用程序开发。想了解更多access数据库的相关内容，可以阅读本专题下面的文章。

596

2024.04.10

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板