0

0

在Python中使用NumPy高效实现2D数组滑动窗口操作

碧海醫心

碧海醫心

发布时间:2025-10-15 11:49:18

|

1009人浏览过

|

来源于php中文网

原创

在python中使用numpy高效实现2d数组滑动窗口操作

本文详细介绍了如何在Python中利用NumPy库高效地对二维数组执行滑动窗口操作。我们将对比手动循环实现与NumPy内置的`sliding_window_view`函数,展示后者在性能和代码简洁性上的显著优势,并提供具体代码示例和使用注意事项,帮助读者掌握这一强大的数据处理技巧。

引言:滑动窗口操作及其重要性

滑动窗口(Sliding Window)是一种在数据处理中广泛应用的技术,尤其在图像处理、信号处理、时间序列分析和机器学习等领域。它通过在数据上“滑动”一个固定大小的窗口,对窗口内的数据进行局部操作(如求和、求平均、求中位数等),从而提取局部特征或进行局部转换。

在Python中处理大规模数组数据时,效率是关键。传统的基于循环的滑动窗口实现方式虽然直观,但往往伴随着性能瓶颈,尤其是在处理大型二维数组时。本教程将重点介绍NumPy库中numpy.lib.stride_tricks.sliding_window_view函数,它提供了一种高度优化的方法来创建滑动窗口的“视图”,避免了数据复制,从而极大地提高了处理效率。

传统手动循环实现滑动窗口的局限性

在深入探讨NumPy的优化方案之前,我们先来看一个典型的手动实现滑动窗口的例子。这种方法通常涉及嵌套循环和数组切片,以逐个提取每个窗口。

立即学习Python免费学习笔记(深入)”;

假设我们有一个二维数组median_x_array,需要提取所有3x3的滑动窗口,并将其展平后存储。为了处理边界情况,我们通常会先对数组进行填充(padding)。

import numpy as np

# 示例二维数组 (例如,一个5x5的随机数组)
median_x_array = np.random.rand(5, 5)
window_size = 3

# 用于存储展平后的滑动窗口
median_x_neighbors_manual = []

# 对数组进行填充,这里使用 'wrap' 模式,填充宽度为1 (对于3x3窗口)
# pad_width = (window_size - 1) // 2
padded_array_manual = np.pad(median_x_array, pad_width=1, mode='wrap')

print("原始数组:\n", median_x_array)
print("\n填充后的数组:\n", padded_array_manual)

# 通过嵌套循环手动实现滑动窗口
# 循环范围需要考虑窗口大小,确保不会超出填充数组的边界
for i in range(padded_array_manual.shape[0] - window_size + 1):
    for j in range(padded_array_manual.shape[1] - window_size + 1):
        # 提取当前窗口
        subarray = padded_array_manual[i:i+window_size, j:j+window_size]
        # 将窗口展平
        flattened_subarray = subarray.flatten()
        median_x_neighbors_manual.append(flattened_subarray)

print("\n手动实现的前3个滑动窗口(展平):\n", median_x_neighbors_manual[:3])
print("手动实现的滑动窗口总数:", len(median_x_neighbors_manual))

这种手动实现方式的问题在于:

Insou AI
Insou AI

Insou AI 是一款强大的人工智能助手,旨在帮助你轻松创建引人入胜的内容和令人印象深刻的演示。

下载
  1. 性能开销:每次迭代都会创建一个新的子数组视图,虽然NumPy的切片操作本身效率较高,但大量的循环和切片操作在大型数组上仍然会产生显著的性能开销。
  2. 代码冗余:需要编写多层嵌套循环来管理窗口的滑动逻辑,代码相对繁琐。
  3. 内存效率:虽然subarray是视图,但如果后续对flattened_subarray进行复制操作,则会产生额外的内存消耗。

使用 numpy.lib.stride_tricks.sliding_window_view 优化滑动窗口操作

NumPy的sliding_window_view函数提供了一种更高效、更简洁的方式来创建滑动窗口。它不复制数据,而是返回一个原始数组的“视图”,这个视图的形状被调整为包含所有可能的滑动窗口。这使得对窗口的后续操作能够直接在视图上进行,从而避免了大量的数据复制和循环开销。

函数介绍

numpy.lib.stride_tricks.sliding_window_view(x, window_shape, axis=None, subok=False, writeable=False)

  • x: 输入的NumPy数组。
  • window_shape: 一个表示窗口形状的元组。例如,对于一个3x3的窗口,window_shape=(3, 3)。
  • axis: 可选参数,指定应用窗口的轴。如果为None(默认),则窗口应用于所有轴。
  • subok: 如果为True,子类会传递。
  • writeable: 如果为True,返回的视图是可写的。

优化实现示例

我们使用与之前手动实现相同的原始数组和填充逻辑,然后展示如何用sliding_window_view来实现。

import numpy as np
from numpy.lib.stride_tricks import sliding_window_view

# 示例二维数组 (与手动实现保持一致)
median_x_array = np.random.rand(5, 5)
window_size = 3

# 首先进行填充,与手动实现保持一致
padded_array_auto = np.pad(median_x_array, pad_width=1, mode='wrap')

print("填充后的数组 (用于 sliding_window_view):\n", padded_array_auto)

# 使用 sliding_window_view 生成滑动窗口视图
# window_shape=(window_size, window_size) 表示一个3x3的窗口
rolling_views = sliding_window_view(padded_array_auto, window_shape=(window_size, window_size))

# rolling_views 的形状分析:
# 如果原始填充数组形状为 (M, N),窗口形状为 (W_row, W_col),
# 那么 rolling_views 的形状将是 (M - W_row + 1, N - W_col + 1, W_row, W_col)。
# 例如,对于 (7,7) 的填充数组和 (3,3) 的窗口,结果是 (7-3+1, 7-3+1, 3, 3) = (5, 5, 3, 3)。
print("\n使用 sliding_window_view 生成的视图形状:", rolling_views.shape)

# 将前两个维度(窗口的行和列位置)展平,以便逐个访问每个3x3窗口
# 结果将是一个 (窗口总数, window_size, window_size) 的数组
# 如果需要将每个窗口展平为1D数组,可以进一步 reshape
all_windows_flattened_auto = rolling_views.reshape(-1, window_size * window_size)

# 如果需要,可以对每个窗口应用函数(例如,计算中位数)
# 这里我们只是将其展平并存储,与原始问题保持一致
median_x_neighbors_auto = all_windows_flattened_auto.tolist() # 转换为列表以便与手动实现比较

print("\n使用 sliding_window_view 实现的前3个滑动窗口(展平):\n", median_x_neighbors_auto[:3])
print("使用 sliding_window_view 实现的滑动窗口总数:", len(median_x_neighbors_auto))

# 示例:直接对所有窗口计算中位数
# np.median 函数可以沿着指定的轴进行计算
# axis=(-2, -1) 表示对最后两个维度(即每个3x3窗口内部的元素)进行中位数计算
medians_per_window = np.median(rolling_views, axis=(-2, -1))
print("\n每个窗口的中位数结果:\n", medians_per_window)
print("中位数结果的形状:", medians_per_window.shape)

通过sliding_window_view,我们一步就得到了所有滑动窗口的视图。后续的聚合操作(如计算中位数、均值等)可以直接在rolling_views上使用NumPy的聚合函数完成,通常指定axis=(-2, -1)来对每个窗口内部的元素进行操作。

注意事项与总结

  1. 视图而非副本:sliding_window_view返回的是一个视图,这意味着它不复制原始数据。修改视图中的元素会同时修改原始数组中的相应位置。这对于内存效率非常有利,但也需要在使用时注意,避免意外修改原始数据。如果需要独立副本,请使用.copy()方法。
  2. 填充(Padding):sliding_window_view本身不提供填充功能。如果需要处理数组边缘的窗口(即窗口部分或全部超出数组边界),必须在调用sliding_window_view之前使用np.pad对原始数组进行适当的填充。填充模式(如'constant'、'reflect'、'wrap'等)应根据具体应用场景选择。
  3. 窗口形状与维度:window_shape参数必须与你希望的窗口维度匹配。对于二维数组上的3x3窗口,应设置为(3, 3)。对于更高维度的数组,可以指定多维窗口。
  4. 性能优势:sliding_window_view的性能优势在于其基于stride tricks的实现,它通过改变数组的步长来“虚拟”地创建窗口,避免了大量的数据复制和Python层面的循环,从而显著提高了大型数组滑动窗口操作的效率。
  5. 后续处理:一旦获得rolling_views,可以利用NumPy强大的广播和聚合功能,对所有窗口进行并行处理,例如np.mean(rolling_views, axis=(-2, -1))计算每个窗口的平均值,或者rolling_views.reshape(-1, window_size * window_size)来获取所有展平的窗口。

通过本文的介绍,您应该已经掌握了在Python中使用NumPy的sliding_window_view函数高效执行二维数组滑动窗口操作的方法。这种方法不仅代码简洁,而且在处理大规模数据时能提供显著的性能提升,是进行科学计算和数据分析的强大工具

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

56

2025.09.03

go语言 数组和切片
go语言 数组和切片

本专题整合了go语言数组和切片的区别与含义,阅读专题下面的文章了解更多详细内容。

56

2025.09.03

css中的padding属性作用
css中的padding属性作用

在CSS中,padding属性用于设置元素的内边距。想了解更多padding的相关内容,可以阅读本专题下面的文章。

176

2023.12.07

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

48

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

88

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

270

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号