Python多线程中的竞态条件与同步机制：深入理解共享数据安全

花韻仙語

发布时间：2025-10-28 12:54:22

290人浏览过

来源于php中文网

原创

Python多线程中的竞态条件与同步机制：深入理解共享数据安全

本文深入探讨了python多线程操作共享变量时可能引发的竞态条件问题。通过分析一个简单的计数器示例，解释了为何在不同操作系统或执行环境下，竞态条件的结果可能看似不同，并强调了这种结果的非确定性。文章重点介绍了如何使用`threading.barrier`等同步机制来协调线程执行，确保共享数据的完整性和操作的原子性，从而避免不可预测的程序行为。

在多线程编程中，当多个线程尝试同时访问和修改同一个共享资源（如全局变量）时，如果没有适当的同步机制，就可能导致所谓的“竞态条件”（Race Condition）。竞态条件是指程序的执行结果依赖于线程执行的相对时序，这种时序通常是不可预测的，从而导致程序行为的不确定性。

理解竞态条件：非原子操作的风险

考虑以下Python代码示例，它创建了两个线程，一个递增全局变量x一百万次，另一个递减x一百万次：

import threading
import os

x = 0;

class Thread1(threading.Thread):       
    def run(self): 
        global x
        for i in range(1,1000000):
            x = x + 1

class Thread2(threading.Thread):
    def run(self):  
        global x
        for i in range(1,1000000):
            x = x - 1

t1 = Thread1()
t2 = Thread2()
t1.start()
t2.start()
t1.join()
t2.join()

print("Sum is "+str(x));

理论上，如果两个线程各自执行一百万次加一和减一操作，最终x的值应该为0。然而，实际运行这段代码时，你会发现x的值几乎不可能是0，而且每次运行结果都可能不同。这就是竞态条件的典型表现。

x = x + 1 这样的看似简单的操作，在底层并不是原子性的。它通常包括以下几个步骤：

立即学习“Python免费学习笔记（深入）”；

从内存中读取x的当前值。
将x的值加1。
将新值写回内存中的x。

当两个线程同时执行这些步骤时，就可能发生交错。例如：

线程A读取x（假设为0）。
线程B读取x（仍为0）。
线程A将x加1（结果为1）。
线程A将1写回x。
线程B将x减1（结果为-1）。
线程B将-1写回x。

在这种情况下，尽管线程A完成了加1操作，但其结果被线程B的写入覆盖，最终x的值为-1，而不是预期的0。这种交错是随机的，取决于操作系统调度器如何分配CPU时间片给不同的线程。

为什么在不同系统上表现不同？

问题中提到在Windows 11上运行可能得到0，而在Cygwin上则不是0。这种现象并非说明在Windows 11上没有竞态条件，而是由于操作系统调度策略、CPU核心数、线程启动时机等因素的偶然性。在某些特定运行中，线程的执行顺序可能恰好避免了严重的交错，导致最终结果接近或等于0。然而，这并不能保证每次都如此，也不能消除竞态条件本身。竞态条件是代码逻辑固有的问题，与运行环境无关，只是其表现形式可能因环境而异。

解决竞态条件：使用同步机制

为了确保共享数据在多线程环境下的正确性，我们需要引入同步机制。Python的threading模块提供了多种同步原语，如锁（Lock）、信号量（Semaphore）、条件变量（Condition）以及屏障（Barrier）等。

threading.Barrier 的应用

threading.Barrier（屏障）是一种特殊的同步机制，它允许固定数量的线程在某个点等待，直到所有线程都到达该点后，才能一起继续执行。这在需要确保一组线程同时开始某个任务，或者在某个阶段点进行同步时非常有用。

以下代码展示了如何使用threading.Barrier来协调两个线程的启动，从而更清晰地观察或控制竞态条件的影响：

靠岸学术

一款集翻译，阅读，文献管理于一体的英文文献阅读器

下载

import threading

# 创建一个屏障，需要2个线程才能通过
# timeout参数可选，表示等待超时时间
b = threading.Barrier(2, timeout=5)

x = 0;

class Thread1(threading.Thread):       
    def run(self): 
        global x
        # 线程在此等待，直到所有参与线程都调用了b.wait()
        print(f"Thread1 waiting at barrier. x={x}")
        b.wait() 
        print(f"Thread1 passed barrier. Starting operations. x={x}")
        for i in range(int(1e5)): # 假设这里是x += i，与原答案保持一致
            x += i

class Thread2(threading.Thread):
    def run(self):  
        global x
        # 线程在此等待，直到所有参与线程都调用了b.wait()
        print(f"Thread2 waiting at barrier. x={x}")
        b.wait()
        print(f"Thread2 passed barrier. Starting operations. x={x}")
        for i in range(int(1e5)): # 假设这里是x -= i，与原答案保持一致
            x -= i

t1 = Thread1()
t2 = Thread2()
t1.start()
t2.start()
t1.join()
t2.join()

print("Final Sum is "+str(x));

在这个修改后的示例中：

b = threading.Barrier(2, timeout=5) 创建了一个屏障，要求两个线程都必须到达。
b.wait() 方法是关键。当线程调用 b.wait() 时，它会阻塞，直到第二个线程也调用了 b.wait()。一旦两个线程都到达屏障点，它们会同时被释放，继续执行后续代码。
通过这种方式，我们确保了两个线程几乎同时开始对x进行递增和递减操作，从而更能稳定地观察到竞态条件的影响。

需要注意的是，即使使用了Barrier来同步启动，上述代码中的x += i和x -= i操作仍然是非原子性的，竞态条件依然存在。Barrier的作用是同步线程的“起点”，而不是保护共享变量的“访问”。

其他常用的同步机制

为了真正保护共享变量，使其操作具有原子性，更常用的方法是使用锁：

threading.Lock (互斥锁)：这是最基本的同步原语。它确保在任何给定时刻，只有一个线程可以持有锁。当一个线程需要访问共享资源时，它会尝试获取锁；如果锁已经被其他线程持有，它就会阻塞，直到锁被释放。

import threading

x = 0
x_lock = threading.Lock() # 创建一个锁

class Thread1(threading.Thread):       
    def run(self): 
        global x
        for i in range(1,1000000):
            x_lock.acquire() # 获取锁
            try:
                x = x + 1
            finally:
                x_lock.release() # 释放锁，确保即使发生异常也能释放

class Thread2(threading.Thread):
    def run(self):  
        global x
        for i in range(1,1000000):
            x_lock.acquire()
            try:
                x = x - 1
            finally:
                x_lock.release()

t1 = Thread1()
t2 = Thread2()
t1.start()
t2.start()
t1.join()
t2.join()

print("Final Sum is "+str(x)); # 此时结果将稳定为0

使用with x_lock: 语句可以更简洁、安全地管理锁的获取和释放，因为它会自动处理异常情况下的释放。

threading.Semaphore (信号量)：信号量用于控制对共享资源的访问数量。它维护一个内部计数器，当计数器大于0时，线程可以获取信号量并递减计数器；当计数器为0时，线程会被阻塞。释放信号量时，计数器递增。
threading.RLock (可重入锁)：与Lock类似，但允许同一个线程多次获取锁，而不会造成死锁。

总结与最佳实践

在多线程编程中，处理共享数据是核心挑战之一。

识别共享资源：首先要识别出在多个线程之间共享的、可变的数据。
理解竞态条件：认识到即使是简单的操作也可能不是原子性的，并可能导致竞态条件。
选择合适的同步机制：
- 对于需要保护临界区（一段代码，其中访问共享资源）以确保数据一致性的场景，通常使用互斥锁（Lock或RLock）。
- 对于需要限制同时访问某个资源的线程数量的场景，可以使用信号量（Semaphore）。
- 对于需要协调多个线程在特定点同步开始或结束任务的场景，可以使用屏障（Barrier）。
避免死锁：在使用锁时，要特别注意避免死锁。死锁通常发生在多个线程互相等待对方释放锁的情况下。
最小化临界区：只在必要时才持有锁，并尽快释放，以减少线程阻塞时间，提高并发性能。