0

0

Python mmap 高效写入设备文件:解决写入失败问题

DDD

DDD

发布时间:2025-10-13 10:09:32

|

426人浏览过

|

来源于php中文网

原创

python mmap 高效写入设备文件:解决写入失败问题

本文深入探讨了在Python中使用`mmap`模块向Linux设备文件写入数据时可能遇到的问题及解决方案。重点阐述了使用内置`open()`函数而非`os.open()`的重要性,并结合`mmap.ACCESS_WRITE`模式,提供了一个健壮的示例代码,以确保数据能够成功写入内存映射区域并同步到设备文件,同时涵盖了内存映射的关键概念和最佳实践。

Python mmap模块概述与设备文件操作

mmap模块是Python中用于创建和操作内存映射文件的接口。通过内存映射,程序可以将文件或设备(如PCI设备的内存区域)的一部分直接映射到进程的地址空间,从而允许像访问内存一样访问文件内容,这通常比传统的读写操作更高效。在Linux系统中,访问设备文件(例如/dev/mem或PCI设备的resource0文件)是常见的应用场景,允许用户空间程序直接与硬件进行交互。

遇到的挑战:mmap写入设备文件失败

在使用mmap向设备文件写入数据时,开发者可能会遇到一个令人困惑的问题:尽管能够成功读取设备文件中的现有值,但尝试写入新值后,重新读取却发现数据并未更新。这表明写入操作实际上并未生效。

最初的尝试可能类似于以下代码片段,其中使用了os.open来获取文件描述符,并结合struct.pack来打包要写入的整数值:

立即学习Python免费学习笔记(深入)”;

import struct, os, mmap, sys

def write_problematic(addr, size, data):
    filename = "<pci_device_file>/resource0" # 替换为实际的设备文件路径

    psize = os.sysconf("SC_PAGE_SIZE")
    base_offset = int(addr // psize) * psize
    seek_sz = int(addr % psize)
    map_size = seek_sz + size

    # 使用 os.open 打开文件
    fd = os.open(filename, os.O_RDWR | os.O_SYNC)

    mem = mmap.mmap(fd, map_size,
                    mmap.MAP_SHARED,
                    mmap.PROT_READ | mmap.PROT_WRITE,
                    offset=base_offset)

    # ... (读取、写入、再次读取逻辑,如问题描述所示) ...

    mem.seek(seek_sz, os.SEEK_SET)
    packed_data = struct.pack("I", data) # 假设写入32位无符号整数
    print(f'尝试写入: {packed_data}')
    mem.write(packed_data)
    mem.flush() # 尝试刷新到磁盘/设备

    mem.seek(seek_sz, os.SEEK_SET)
    val_after_write = mem.read(size)
    print(f'写入后读取: {val_after_write}')
    print(f'写入后解析: {hex(struct.unpack("I", val_after_write)[0])}')

    os.close(fd)
    return True

# 示例调用 (假设0x4330是可写的地址,4字节,写入0x113d0000)
# write_problematic(0x4330, 4, 0x113d0000)

在上述代码中,尽管mmap的创建参数(MAP_SHARED, PROT_WRITE)看似正确,且os.O_RDWR也提供了读写权限,但实际写入操作却未能生效。

AI Web Designer
AI Web Designer

AI网页设计师,快速生成个性化的网站设计

下载

解决方案:使用内置open()函数与mmap.ACCESS_WRITE

问题的核心在于文件描述符的来源。对于mmap操作,尤其是需要写入的场景,使用Python内置的open()函数来获取文件对象,然后通过其fileno()方法获取文件描述符,通常比直接使用os.open()更为稳健。此外,明确指定mmap的访问模式为mmap.ACCESS_WRITE或mmap.ACCESS_READ | mmap.ACCESS_WRITE也是确保写入权限的关键。

内置open()函数在处理文件和设备时,其内部机制可能更好地与mmap模块所需的底层文件语义兼容。当使用"r+b"模式打开文件时,它提供了二进制读写能力,这对于设备文件操作至关重要。

以下是修正后的mmap写入函数示例:

import struct, os, mmap, sys

def mmap_write_device_file(addr, size, data, filename="<pci_device_file>/resource0"):
    """
    使用mmap向指定设备文件地址写入打包的整数值。

    Args:
        addr (int): 目标物理地址。
        size (int): 要写入的字节数。
        data (int): 要写入的整数值。
        filename (str): 设备文件的路径。

    Returns:
        bool: 写入操作是否成功。
    """
    psize = os.sysconf("SC_PAGE_SIZE") # 获取系统页面大小

    # mmap要求偏移量是页面大小的倍数
    base_offset = (addr // psize) * psize

    # 页面内的偏移量
    seek_offset_in_page = addr % psize

    # 需要映射的总大小 = 页面内偏移量 + 请求的写入大小
    map_size = seek_offset_in_page + size

    print(f"映射文件: {filename}")
    print(f"目标地址: {hex(addr)}, 写入大小: {size} 字节, 写入数据: {hex(data)}")
    print(f"页面大小: {psize}")
    print(f"基偏移量 (页面对齐): {hex(base_offset)}")
    print(f"页面内偏移量: {seek_offset_in_page}")
    print(f"映射总大小: {map_size}")

    try:
        # 使用内置的 open() 函数以二进制读写模式打开文件
        with open(filename, "r+b") as fobj:
            # 使用 mmap.mmap 创建内存映射,指定 ACCESS_WRITE
            # length=0 映射整个文件,但此处我们根据 map_size 精确映射
            with mmap.mmap(fobj.fileno(), map_size,
                            access=mmap.ACCESS_WRITE,
                            offset=base_offset) as mem:

                # 定位到目标偏移量(在映射区域内)
                mem.seek(seek_offset_in_page, os.SEEK_SET)

                # 读取旧值进行比较
                old_val_bytes = mem.read(size)
                old_val_int = struct.unpack("I", old_val_bytes)[0]
                print(f'读取到旧值 (字节): {old_val_bytes}')
                print(f'读取到旧值 (整数): {hex(old_val_int)}')

                # 打包要写入的数据
                packed_data = struct.pack("I", data)
                print(f'准备写入 (字节): {packed_data}')

                # 重新定位到写入位置
                mem.seek(seek_offset_in_page, os.SEEK_SET)

                # 写入数据
                mem.write(packed_data)

                # 强制将修改同步到磁盘/设备
                mem.flush()
                print("数据已写入并刷新。")

                # 再次读取以验证写入是否成功
                mem.seek(seek_offset_in_page, os.SEEK_SET)
                new_val_bytes = mem.read(size)
                new_val_int = struct.unpack("I", new_val_bytes)[0]
                print(f'写入后读取 (字节): {new_val_bytes}')
                print(f'写入后读取 (整数): {hex(new_val_int)}')

                if new_val_int == data:
                    print("验证成功:数据已正确写入。")
                    return True
                else:
                    print("验证失败:写入的数据与预期不符。")
                    return False

    except FileNotFoundError:
        print(f"错误: 设备文件 '{filename}' 未找到。")
        return False
    except PermissionError:
        print(f"错误: 没有足够的权限访问设备文件 '{filename}'。请确保以root用户运行或具有相应权限。")
        return False
    except Exception as e:
        print(f"发生未知错误: {e}")
        return False

# 示例调用 (假设0x4330是可写的地址,4字节,写入0x113d0000)
# 注意:在实际运行前,请将 "<pci_device_file>/resource0" 替换为你的设备文件路径
# 并且确保你有权限访问该设备文件,通常需要root权限。
if __name__ == "__main__":
    if len(sys.argv) < 2:
        print("用法: python your_script.py <value_to_write_hex>")
        sys.exit(1)

    # 假设要写入的地址和大小是固定的
    target_addr = 0x4330
    write_size = 4 # 写入一个32位整数

    # 从命令行参数获取要写入的值 (十六进制字符串)
    value_to_write = int(sys.argv[1], 16)

    # 调用函数执行写入
    success = mmap_write_device_file(target_addr, write_size, value_to_write)
    print(f"写入操作 {'成功' if success else '失败'}")

关键改进点:

  1. 文件打开方式: 使用 with open(filename, "r+b") as fobj:。"r+b"模式以二进制读写方式打开文件,并通过上下文管理器确保文件正确关闭。
  2. 文件描述符: fobj.fileno() 返回文件对象的底层文件描述符,这与mmap模块的预期更为匹配。
  3. mmap访问模式: access=mmap.ACCESS_WRITE 明确指定了内存映射区域的写入权限。
  4. 数据刷新: mem.flush() 在写入数据后被调用,确保内存中的修改被同步到底层文件或设备。这对于确保数据持久化或立即反映在硬件状态中至关重要。
  5. 错误处理: 增加了try-except块来捕获常见的文件操作错误,如FileNotFoundError和PermissionError。

注意事项与最佳实践

  1. 权限问题: 访问设备文件通常需要root权限。如果遇到PermissionError,请尝试使用sudo运行Python脚本。
  2. 文件模式: 对于设备文件,"r+b"(读写二进制)是推荐的打开模式。
  3. 页面对齐: mmap的offset参数必须是系统页面大小的倍数。代码中已经包含了计算base_offset的逻辑,确保了这一点。
  4. map_size的确定: 映射区域的大小(map_size)需要根据实际需求精确计算。如果length=0,则mmap会尝试映射整个文件,这可能不适用于大型设备文件或内存区域。
  5. 数据打包与解包: 使用struct模块来处理二进制数据(如整数、浮点数等)的打包和解包,确保数据格式与硬件期望的一致。例如,"I"代表无符号整数,其字节序可能需要根据系统架构(大端/小端)进行调整。
  6. 资源管理: 始终使用with语句来管理文件对象和mmap对象,以确保它们在不再需要时被正确关闭和释放。
  7. mmap.ACCESS_WRITE vs mmap.PROT_WRITE: mmap.mmap()构造函数既接受access参数(例如mmap.ACCESS_WRITE),也接受prot参数(例如mmap.PROT_WRITE)。当同时提供两者时,access参数通常会覆盖或优先于prot参数。对于简单的读写需求,access参数通常更简洁易用。

总结

在Python中使用mmap模块与设备文件进行高效交互时,正确的mmap初始化和文件处理方式至关重要。通过采用内置的open()函数获取文件描述符,并明确指定mmap.ACCESS_WRITE模式,可以有效解决向设备文件写入数据失败的问题。结合struct模块进行数据打包、处理页面对齐以及适当的错误处理,可以构建出健壮且高效的设备文件内存映射解决方案。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1958

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

658

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2401

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

47

2026.01.19

length函数用法
length函数用法

length函数用于返回指定字符串的字符数或字节数。可以用于计算字符串的长度,以便在查询和处理字符串数据时进行操作和判断。 需要注意的是length函数计算的是字符串的字符数,而不是字节数。对于多字节字符集,一个字符可能由多个字节组成。因此,length函数在计算字符串长度时会将多字节字符作为一个字符来计算。更多关于length函数的用法,大家可以阅读本专题下面的文章。

954

2023.09.19

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

26

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.6万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号