0

0

深入理解 Python ctypes 结构体及其指针的深度复制

心靈之曲

心靈之曲

发布时间:2025-09-25 14:01:01

|

475人浏览过

|

来源于php中文网

原创

深入理解 Python ctypes 结构体及其指针的深度复制

在 Python ctypes 模块中,对包含指针的结构体进行深度复制是一项复杂任务。本文将详细介绍如何正确地复制 ctypes 结构体,特别是当结构体成员包含指向外部动态分配数据的指针时。我们将探讨 from_buffer_copy 方法进行浅层复制,并结合手动迭代和 ct.cast 来实现指针所指数据的深度复制,确保原始对象与副本之间的数据独立性。

ctypes 结构体与深度复制的挑战

当使用 ctypes 模块定义与 c 语言兼容的结构体时,我们经常会遇到结构体成员是其他数据类型的指针的情况。例如,一个结构体可能包含一个 pointer(c_float) 类型的字段,它指向一块外部的浮点数数组。在这种场景下,标准的 python 复制机制(如 copy.deepcopy)可能无法正确地处理 ctypes 结构体内部的内存管理和指针语义,导致复制结果不符合预期,甚至引发 typeerror。

深度复制一个 ctypes 结构体的目标是:

  1. 复制结构体本身的所有值类型字段。
  2. 对于结构体中包含的指针字段,不仅要复制指针的值(即地址),更重要的是要复制指针所指向的数据,并让副本中的指针指向这块新复制的数据。这样,对原始结构体所指数据的修改不会影响到副本。

定义包含指针的 ctypes 结构体

让我们以一个 Group 结构体为例,它包含一个浮点数指针数组 DataChannel,每个指针指向一个长度由 ChSize 数组对应元素决定的浮点数序列。

import ctypes as ct

class Group(ct.Structure):
    _fields_ = (
        ('ChSize', ct.c_uint32 * 9),          # 存储每个通道的数据大小
        ('DataChannel', ct.POINTER(ct.c_float) * 9), # 9个指向浮点数数组的指针
        ('TriggerTimeLag', ct.c_uint32),
        ('StartIndexCell', ct.c_uint16)
    )

    def __repr__(self):
        """
        为Group对象提供一个可读的字符串表示,方便调试。
        它会打印结构体的值类型字段,并尝试打印DataChannel指针所指向的数据。
        """
        s = f'Group(ChSize={self.ChSize[:]}, TriggerTimeLag={self.TriggerTimeLag}, StartIndexCell={self.StartIndexCell})\n'
        for i in range(9):
            # 确保只读取ChSize指定长度的数据,避免越界或读取无效内存
            try:
                data_slice = self.DataChannel[i][:self.ChSize[i]]
            except Exception:
                data_slice = [] # 如果指针无效或大小为0,则显示为空列表
            s += f'  DataChannel[{i}] = {data_slice}\n'
        return s

在这个结构体中,ChSize、TriggerTimeLag 和 StartIndexCell 是值类型,可以直接复制。但 DataChannel 是一个包含 9 个 ct.POINTER(ct.c_float) 类型的数组,每个元素都是一个指针。

实现深度复制方法

为了正确实现 Group 结构体的深度复制,我们需要自定义 deepcopy 方法。核心思想是:首先对结构体本身进行浅层复制,然后遍历所有指针字段,对它们所指向的数据进行独立复制。

立即学习Python免费学习笔记(深入)”;

class Group(ct.Structure):
    _fields_ = (
        ('ChSize', ct.c_uint32 * 9),
        ('DataChannel', ct.POINTER(ct.c_float) * 9),
        ('TriggerTimeLag', ct.c_uint32),
        ('StartIndexCell', ct.c_uint16)
    )

    def __repr__(self):
        s = f'Group(ChSize={self.ChSize[:]}, TriggerTimeLag={self.TriggerTimeLag}, StartIndexCell={self.StartIndexCell})\n'
        for i in range(9):
            try:
                data_slice = self.DataChannel[i][:self.ChSize[i]]
            except Exception:
                data_slice = []
            s += f'  DataChannel[{i}] = {data_slice}\n'
        return s

    def deepcopy(self):
        # 1. 对结构体进行浅层复制
        # ct.Structure.from_buffer_copy(self) 会创建一个新的结构体实例,
        # 并将原始结构体内存缓冲区的内容复制过来。
        # 这会复制所有值类型字段(如ChSize, TriggerTimeLag, StartIndexCell)
        # 以及指针的值(即地址),但不会复制指针所指向的数据。
        copy = Group.from_buffer_copy(self)

        # 2. 遍历DataChannel指针数组,深度复制每个指针所指向的数据
        for i, (size, channel_ptr) in enumerate(zip(self.ChSize, self.DataChannel)):
            if size > 0 and channel_ptr: # 确保有数据且指针有效
                # 创建一个新的ctypes数组,用于存储复制的数据。
                # (ct.c_float * size) 定义了一个C风格的浮点数数组类型。
                # (*channel_ptr[:size]) 从原始指针指向的位置读取指定长度的数据,并作为初始化参数。
                new_data_array = (ct.c_float * size)(*channel_ptr[:size])

                # 将新创建的数组转换为POINTER(ct.c_float)类型,并赋值给副本的DataChannel字段。
                # ct.cast 用于将一个ctypes对象转换为另一个ctypes类型。
                copy.DataChannel[i] = ct.cast(new_data_array, ct.POINTER(ct.c_float))
            else:
                # 如果原始通道没有数据或指针无效,则副本对应通道也置空
                copy.DataChannel[i] = None

        return copy

代码解析:

  1. copy = Group.from_buffer_copy(self): 这是实现浅层复制的关键一步。from_buffer_copy 方法会创建一个新的 Group 实例,并将其内部缓冲区的内容与原始 self 对象的缓冲区内容完全复制。这意味着所有像 ChSize、TriggerTimeLag、StartIndexCell 这样的值类型字段会被直接复制。对于 DataChannel 这样的指针数组,复制的是指针(即内存地址),而不是指针所指向的实际数据。此时,copy.DataChannel 中的指针仍然指向原始 self.DataChannel 所指向的内存区域。

  2. for i, (size, channel_ptr) in enumerate(zip(self.ChSize, self.DataChannel)):: 循环遍历 Group 结构体中的 9 个数据通道。size 来自 self.ChSize,表示当前通道的数据长度;channel_ptr 是 self.DataChannel 中的一个指针,指向原始数据。

    ImgGood
    ImgGood

    免费在线AI照片编辑器

    下载
  3. new_data_array = (ct.c_float * size)(*channel_ptr[:size]):

    • ct.c_float * size 创建了一个新的 ctypes 数组类型,其大小为 size。
    • *channel_ptr[:size] 是一个非常巧妙的用法。channel_ptr[:size] 会从原始指针 channel_ptr 所指向的内存位置读取 size 个 ct.c_float 类型的数据,并返回一个 Python 列表。
    • 将这个列表作为参数传递给 (ct.c_float * size) 构造函数,会创建一个新的 ctypes 数组,并将列表中的数据复制到这个新数组的内存中。这块新内存是独立于原始数据的。
  4. copy.DataChannel[i] = ct.cast(new_data_array, ct.POINTER(ct.c_float)):

    • new_data_array 是一个 ctypes 数组对象。我们需要将其转换为一个 ct.POINTER(ct.c_float) 类型,才能赋值给 copy.DataChannel[i]。
    • ct.cast(new_data_array, ct.POINTER(ct.c_float)) 完成了这个类型转换,它返回一个指向 new_data_array 内存起始位置的指针。
    • 将这个新的指针赋值给 copy.DataChannel[i],这样副本中的指针就指向了新复制的数据,实现了深度复制。

完整示例与验证

下面的示例代码演示了如何创建、初始化一个 Group 对象,然后对其进行深度复制,并通过修改原始对象来验证副本的独立性。

import ctypes as ct

class Group(ct.Structure):
    _fields_ = (
        ('ChSize', ct.c_uint32 * 9),
        ('DataChannel', ct.POINTER(ct.c_float) * 9),
        ('TriggerTimeLag', ct.c_uint32),
        ('StartIndexCell', ct.c_uint16)
    )

    def __repr__(self):
        s = f'Group(ChSize={self.ChSize[:]}, TriggerTimeLag={self.TriggerTimeLag}, StartIndexCell={self.StartIndexCell})\n'
        for i in range(9):
            try:
                # 尝试访问指针指向的数据,注意处理可能的空指针或无效大小
                if self.DataChannel[i] and self.ChSize[i] > 0:
                    data_slice = self.DataChannel[i][:self.ChSize[i]]
                else:
                    data_slice = []
            except Exception as e:
                # 捕获可能因无效指针或内存访问错误导致的异常
                data_slice = []
                # print(f"Warning: Could not access DataChannel[{i}] data: {e}")
            s += f'  DataChannel[{i}] = {data_slice}\n'
        return s

    def deepcopy(self):
        copy = Group.from_buffer_copy(self)
        for i, (size, channel_ptr) in enumerate(zip(self.ChSize, self.DataChannel)):
            if size > 0 and channel_ptr:
                new_data_array = (ct.c_float * size)(*channel_ptr[:size])
                copy.DataChannel[i] = ct.cast(new_data_array, ct.POINTER(ct.c_float))
            else:
                copy.DataChannel[i] = None # 确保副本的对应指针也为空

        return copy

# --- 验证部分 ---

# 1. 创建并初始化一个Group对象
group = Group()
group.ChSize[:] = [1, 2, 3, 4, 5, 6, 7, 8, 9] # 设置每个通道的大小
for i, size in enumerate(group.ChSize):
    # 为每个通道创建独立的ctypes浮点数数组,并将其地址赋给DataChannel指针
    data = (ct.c_float * size)(*[1.5 * n for n in range(size)])
    group.DataChannel[i] = ct.cast(data, ct.POINTER(ct.c_float))
group.TriggerTimeLag = 123
group.StartIndexCell = 456
print("--- 原始 Group 对象 ---")
print(group)

# 2. 对原始对象进行深度复制
copy = group.deepcopy()
print("\n--- 深度复制后的 Copy 对象 ---")
print(copy)

# 3. 修改原始Group对象的DataChannel和ChSize
# 将原始对象的ChSize全部设为0,并清空DataChannel指针
group.ChSize[:] = [0] * 9
group.DataChannel[:] = [None] * 9 # 将指针设为None,模拟清空数据
group.TriggerTimeLag = 999 # 修改值类型字段
group.StartIndexCell = 888

print("\n--- 修改后的原始 Group 对象 ---")
print(group)

print("\n--- 再次打印 Copy 对象 (应保持不变) ---")
print(copy) # 验证副本是否独立

输出结果分析:

通过运行上述代码,我们可以观察到:

  • 在修改原始 group 对象后,其 ChSize 变为全零,DataChannel 对应的输出为空列表,TriggerTimeLag 和 StartIndexCell 也发生了变化。
  • 然而,copy 对象在修改原始 group 之后再次打印时,其所有字段(包括 ChSize 和 DataChannel 指向的数据)都保持了复制时的状态,没有受到原始对象修改的影响。这证明了 deepcopy 方法成功地实现了深度复制。

注意事项与总结

  • 内存管理: 当你使用 (ct.c_float * size)(...) 创建新的 ctypes 数组时,Python 会为这些数组分配内存,并由 Python 的垃圾回收机制管理。只要有对 new_data_array 或其指针的引用存在,这块内存就不会被释放。在 deepcopy 方法中,新的 ctypes 数组被 ct.cast 转换为指针并存储在 copy 对象中,因此这些内存会随着 copy 对象的生命周期而存在。
  • 空指针处理: 在 deepcopy 方法中,我们添加了 if size > 0 and channel_ptr: 的检查,以避免尝试复制无效的内存区域或空指针。在 __repr__ 方法中也加入了 try-except 块或条件判断来安全地访问数据。
  • ct.cast 的重要性: ct.cast 是将 ctypes 数组对象(它本身不是一个指针类型)转换为 POINTER 类型所必需的。直接将 new_data_array 赋值给 POINTER 类型的字段会导致 TypeError。
  • 通用性: 这种深度复制模式适用于任何包含指针的 ctypes.Structure。你需要根据结构体中指针字段的数量和类型来调整 deepcopy 方法中的循环和数据复制逻辑。
  • 性能考量: 对于非常大的数据量或频繁的复制操作,这种 Python 级别的深度复制可能会带来一定的性能开销,因为它涉及 Python 对象的创建和数据在 Python 和 C 类型之间的转换。在性能敏感的场景下,可能需要考虑在 C 语言层面实现复制函数并通过 ctypes 调用。

通过上述方法,我们可以有效地解决 ctypes 结构体中包含指针时的深度复制问题,确保数据独立性和程序的健壮性。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

778

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

685

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

769

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

740

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1445

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

571

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

580

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

752

2023.08.11

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

31

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 13.5万人学习

成为PHP架构师-自制PHP框架
成为PHP架构师-自制PHP框架

共28课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号