Python 多线程与多进程：并发编程避坑指南与性能对比

5次阅读

共计 6393 个字符，预计需要花费 16 分钟才能阅读完成。

在现代软件开发中，为了充分利用多核处理器的性能并提高应用程序的响应速度，并发编程已成为一项不可或缺的技能。Python 作为一门广受欢迎的编程语言，也提供了强大的并发编程能力，主要通过 threading（多线程）和 multiprocessing（多进程）两个模块来实现。然而，由于 Python 独特的全局解释器锁（GIL）机制，其并发模型与许多其他语言有所不同，这常常令初学者感到困惑，甚至导致性能不升反降。

本文将深入探讨 Python 多线程与多进程的原理、使用场景、性能差异，并提供详细的避坑指南和最佳实践，帮助开发者更好地驾驭 Python 并发编程，写出高效、健壮的代码。

在深入多线程与多进程之前，我们首先需要理解一些基本概念。

并发 (Concurrency)：指在一段时间内，有多个任务看似同时在执行，但实际上在任意一个时间点，CPU 只有一个任务在运行。任务之间通过快速切换（时间片轮转）来共享 CPU 资源。这通常发生在单核 CPU 上。
并行 (Parallelism)：指在同一时间点，有多个任务真正同时在执行。这需要多核 CPU 或多处理器系统才能实现，每个核心处理一个任务。

理解 Python 的 GIL 是理解其并发编程模型的关键。GIL 是 CPython 解释器中的一个机制，它 确保在任何时刻，只有一个线程可以执行 Python 字节码。这意味着，即使在多核 CPU 上，Python 的多线程也无法实现真正意义上的并行计算，因为 GIL 会阻止多个线程同时占用 CPU 核心。

为什么会有 GIL？ GIL 的存在主要是为了简化 CPython 解释器内存管理，并避免多线程操作共享数据时出现复杂的竞态条件。没有 GIL，Python 的对象模型和垃圾回收机制会变得异常复杂，性能开销可能更大。

GIL 的影响：

I/O 密集型任务（Input/Output-bound）：当线程执行 I/O 操作（如网络请求、文件读写）时，它们会释放 GIL，允许其他线程运行。因此，多线程对于 I/O 密集型任务通常能带来性能提升。
CPU 密集型任务（CPU-bound）：当线程执行纯计算任务时，它们会一直持有 GIL，直到完成计算或遇到某些内部检查点。这意味着 CPU 密集型任务使用多线程并不能利用多核优势，反而可能因为线程切换的开销而降低性能。

Python 的 threading 模块提供了一种高级的、面向对象的线程 API。

当使用 threading 模块创建多个线程时，所有线程都运行在同一个进程的内存空间中。它们共享进程的资源，包括内存、文件句柄等。由于 GIL 的存在，在任何给定时刻，只有一个 Python 线程能够执行字节码。当一个线程遇到 I/O 操作时，它会暂停并释放 GIL，允许其他线程继续执行。

I/O 密集型任务：如网络爬虫、文件下载、数据库查询、Web 服务器处理并发请求等。在这些场景中，线程大部分时间都在等待外部资源，释放 GIL 让其他线程有机会执行，从而提高整体吞吐量。
用户界面 (GUI) 应用程序：将耗时的操作放在单独的线程中执行，以避免阻塞主线程，保持界面的响应性。

共享内存：线程之间可以直接访问和修改相同的变量和数据结构，方便数据共享（但也带来了线程安全问题）。
启动开销小：创建和销毁线程的开销通常比进程小。
上下文切换快：线程的上下文切换比进程快，因为它们共享内存地址空间。

GIL 的限制：
- 误区：认为多线程可以并行执行 CPU 密集型任务。
- 实践：永远不要期望多线程能加速纯 CPU 密集型计算。对于这类任务，应考虑多进程或异步编程。
线程安全与数据竞争：
- 问题：多个线程同时读写共享数据时，可能导致数据不一致或错误的结果。
- 解决方案：
  - 锁 (Lock)：最基本的同步机制。使用 threading.Lock() 创建锁，通过 acquire() 获取锁，release() 释放锁。可以使用 with 语句简化，确保锁被正确释放。
```
import threading
```
  balance = 0
  lock = threading.Lock()
  
  def deposit(amount):
  global balance
  with lock: # 自动获取和释放锁
  balance += amount
```
*   ** 可重入锁 (RLock)**：允许同一个线程多次获取同一把锁，避免死锁。*   ** 信号量 (Semaphore)**：控制同时访问某个资源的线程数量。*   ** 条件变量 (Condition)**：允许线程在满足特定条件时挂起或唤醒。
```
- 避坑：过度使用锁会引入额外的开销，并可能导致死锁。尽量减少共享状态，或使用线程安全的数据结构（如 queue.Queue）进行线程间通信。
死锁 (Deadlock)：
- 问题：两个或多个线程互相等待对方释放资源，导致所有线程都无法继续执行。
- 避免策略：
  - 固定锁的获取顺序：所有线程以相同的顺序获取多个锁。
  - 避免循环等待：确保资源分配图中没有环路。
  - 使用超时机制：尝试获取锁时设置超时，超时未获取则放弃。
守护线程 (Daemon Threads)：
- 概念：守护线程会在主线程结束时自动终止，而不会等待其完成。非守护线程会阻止主线程退出，直到它们自己完成。
- 用途：用于执行后台任务，如日志记录、垃圾回收等，不影响主程序的正常退出。
- 设置：在线程启动前设置 thread.daemon = True。
- 注意：守护线程在被终止时不会进行清理工作，因此不适合处理需要确保完成的任务（如保存数据到文件）。

Python 的 multiprocessing 模块允许创建并管理多个进程，每个进程都有自己独立的 Python 解释器和内存空间。

与线程不同，进程是操作系统分配资源的基本单位。每个进程都有自己独立的地址空间，这意味着它们不会共享内存中的变量。multiprocessing 模块在内部使用 subprocess 模块创建新进程，并且每个进程都有自己的 GIL。因此，多进程可以绕过 GIL 的限制，实现真正的并行计算，充分利用多核 CPU。

CPU 密集型任务：如科学计算、图像处理、大数据分析、复杂算法运算等。在这些场景中，每个进程都可以在不同的 CPU 核心上独立运行，显著提升计算速度。
需要进程隔离的场景：当一个任务失败不应影响其他任务时，进程隔离提供了更好的稳定性。

真正的并行计算：每个进程都有自己的 GIL，可以在不同的 CPU 核心上并行执行 Python 字节码。
进程隔离：一个进程的崩溃不会影响其他进程，提高了程序的健壮性。
利用多核 CPU：充分发挥现代多核处理器的性能。

进程间通信 (IPC)：
- 问题：进程之间不共享内存，不能直接访问对方的变量。
- 解决方案：
  - 队列 (Queue)：multiprocessing.Queue 是最常用的 IPC 方式，它可以在进程之间安全地传递数据。
  - 管道 (Pipe)：multiprocessing.Pipe 提供了一个双向通信的管道，一端发送，另一端接收。适用于两个进程之间的点对点通信。
  - 管理器 (Manager)：multiprocessing.Manager 可以创建一个服务器进程，其他进程通过代理对象访问共享对象（如列表、字典、锁等）。适用于需要共享复杂数据结构或多个进程之间协调的场景。
  - 共享内存 (Value/Array)：multiprocessing.Value 和 multiprocessing.Array 允许在进程间共享原始数据类型或数组。
- 避坑：IPC 会引入额外的开销（序列化 / 反序列化），应尽量减少不必要的通信。
数据共享的开销：
- 问题：如果需要共享大量数据，通过 IPC 传递会产生显著的序列化和反序列化开销。
- 实践：尽量将数据处理逻辑封装在每个进程内部，减少进程间数据传输。对于大数据，可以考虑将数据存储在共享文件系统或数据库中，而不是通过 IPC 直接传输。
进程创建开销：
- 问题：创建和销毁进程比创建和销毁线程的开销大得多，因为它涉及到独立的地址空间、解释器初始化等。
- 实践：
  - 进程池 (Pool)：使用 multiprocessing.Pool 可以预先创建一组工作进程，然后将任务提交给它们。这样可以避免频繁创建和销毁进程的开销。
  - 任务拆分：将任务分解成足够大的块，以抵消进程创建的开销。
Windows 平台兼容性问题：
- 问题：在 Unix-like 系统上，multiprocessing 默认使用 fork 方式创建子进程，子进程会继承父进程的内存空间。而在 Windows 上，默认使用 spawn 方式，子进程会从头开始初始化，父进程的全局变量和导入模块不会被自动继承。
- 实践：
  - 将进程代码放在 if __name__ == '__main__': 块内：这是在 Windows 上运行 multiprocessing 程序的标准做法，确保子进程只导入必要的模块，避免不必要的代码执行。
  - 避免在全局作用域定义需要传递给子进程的函数：确保函数可以在子进程中被正确导入。

特性	多线程 (Threading)	多进程 (Multiprocessing)
GIL 限制	有，无法并行执行 Python 字节码	无，每个进程有自己的 GIL，可实现真正并行
使用场景	I/O 密集型任务	CPU 密集型任务
内存共享	共享内存，数据直接访问，需注意线程安全	不共享内存，通过 IPC 通信
开销	启动开销小，上下文切换快	启动开销大，上下文切换相对慢
健壮性	一个线程崩溃可能影响整个进程	进程隔离，一个进程崩溃不影响其他进程
复杂度	数据同步和避免死锁较复杂	IPC 机制和数据序列化 / 反序列化引入额外复杂度

选择策略：

I/O 密集型任务（等待外部资源）：优先选择 多线程。例如，网络爬虫、文件下载上传、并发请求 API 等。在这种情况下，虽然有 GIL，但线程在等待 I/O 时会释放 GIL，允许其他线程运行，从而提高整体效率。
CPU 密集型任务（大量计算）：优先选择 多进程。例如，复杂的数值计算、图像处理、机器学习模型训练等。每个进程可以独立运行在不同的 CPU 核心上，实现真正的并行计算，充分利用多核处理器。
混合模式：有些任务可能既有 I/O 密集型部分，又有 CPU 密集型部分。在这种情况下，可以考虑结合使用多进程和多线程。例如，使用多个进程分别处理不同的数据块（CPU 密集），每个进程内部再使用多线程处理其 I/O 密集型子任务。

使用 `concurrent.futures` 简化并发编程

Python 3.2 引入的 concurrent.futures 模块提供了一个高级接口，可以更方便地进行并发编程，它抽象了线程和进程的创建和管理细节。

ThreadPoolExecutor：适用于 I/O 密集型任务，内部使用线程池。
ProcessPoolExecutor：适用于 CPU 密集型任务，内部使用进程池。

from concurrent.futures import ThreadPoolExecutor, ProcessPoolExecutor
import time

def task_io(name):
    print(f"Task {name}: Starting I/O...")
    time.sleep(2) # Simulate I/O operation
    print(f"Task {name}: I/O Done.")
    return f"Result {name}"

def task_cpu(n):
    print(f"Task CPU: Calculating for {n}...")
    result = sum(i*i for i in range(n * 1000000)) # Simulate CPU operation
    print(f"Task CPU: Calculation Done for {n}.")
    return result

if __name__ == '__main__':
    print("--- Using ThreadPoolExecutor (I/O bound) ---")
    with ThreadPoolExecutor(max_workers=3) as executor:
        futures = [executor.submit(task_io, i) for i in range(5)]
        for future in futures:
            print(f"Future result: {future.result()}")

    print("n--- Using ProcessPoolExecutor (CPU bound) ---")
    with ProcessPoolExecutor(max_workers=3) as executor:
        futures = [executor.submit(task_cpu, i) for i in range(5)]
        for future in futures:
            print(f"Future result: {future.result()}")

concurrent.futures 模块极大地简化了并发任务的提交、结果获取和错误处理，是推荐使用的并发编程方式。

协程 (`asyncio`) 简介

除了多线程和多进程，Python 还提供了基于协程的异步编程 (asyncio 模块)。asyncio 是单线程并发，通过事件循环和 async/await 语法实现任务的协作式调度。它特别适合处理大量 I/O 密集型任务，因为当一个任务等待 I/O 时，它会主动让出 CPU，允许事件循环调度其他就绪的任务。对于高并发网络应用来说，asyncio 是一种非常高效且资源开销小的方式。

import asyncio

async def fetch_data(url):
    print(f"Fetching {url}...")
    await asyncio.sleep(2) # Simulate network request
    print(f"Finished fetching {url}.")
    return f"Data from {url}"

async def main():
    urls = ["http://example.com/1", "http://example.com/2", "http://example.com/3"]
    tasks = [fetch_data(url) for url in urls]
    results = await asyncio.gather(*tasks)
    print(f"All results: {results}")

if __name__ == "__main__":
    asyncio.run(main())

对于需要处理大量并发 I/O 请求的场景，asyncio 往往是比多线程更高效且更易于管理的解决方案。

并发程序比顺序执行的程序更难调试，因为执行顺序可能不确定，竞态条件和死锁很难复现。

日志记录：详细的日志记录，包括线程 / 进程 ID、时间戳和关键事件，有助于追踪程序的执行流程。
断点调试：使用支持多线程 / 多进程调试的 IDE（如 PyCharm），但仍需注意调试可能会改变时序，掩盖实际问题。
资源监控：使用系统工具（如 top、htop、Windows 任务管理器）监控 CPU 使用率、内存占用、I/O 活动，以评估并发策略的有效性。
避免共享状态：尽量设计无状态的任务，或者将共享状态封装在明确的同步机制中。

Python 的并发编程既强大又富有挑战性。理解 GIL 是区分多线程和多进程适用场景的关键。对于 I/O 密集型任务，多线程（或更推荐的 asyncio 协程）能够有效提高吞吐量。对于 CPU 密集型任务，多进程是实现并行计算、充分利用多核 CPU 的唯一途径。

选择正确的并发模型，并结合 concurrent.futures 提供的便捷接口以及妥善处理进程间通信、线程安全等问题，是构建高性能、可扩展 Python 应用的必经之路。通过本文的避坑指南和最佳实践，相信你将能更好地驾驭 Python 并发编程，写出更加健壮和高效的代码。

正文完

GIL Python 多线程多进程并发编程

发表至： Python

近一天内

0

Python 与 Docker 结合：从入门到实践，容器化部署 Python 应用全攻略

告别繁琐循环：Python `jsonpath` 提升JSON数据提取效率

Python基础入门 Day97 上下文管理器的原理与自定义

Python 基础入门 Day14

Python 函数式编程深度解析：Lambda、Map、Filter 与 Itertools 库的精妙应用

Python 多线程与多进程：并发编程避坑指南与性能对比

Python 并发编程的基石

什么是并发与并行？

Python GIL (Global Interpreter Lock)

Python 多线程 (Threading)

工作原理

使用场景

优势

避坑指南

Python 多进程 (Multiprocessing)

工作原理

使用场景

优势

避坑指南

性能对比与选择策略

最佳实践与进阶话题

使用 `concurrent.futures` 简化并发编程

协程 (`asyncio`) 简介

监控与调试并发程序

总结

Python 基础入门 Day34：使用类方法与静态方法

开启 Google Cloud 实例的 Root 远程登录权限

Python 基础入门 Day35

Python 基础入门 Day36

Python 基础入门 Day37：集成学习初探（随机森林 & 梯度提升树）

隐藏 nodeloc等类似论坛广告和欢迎横幅油猴脚本

Python 基础入门 Day38：Flask 入门实践（一）搭建你的第一个 Web 应用

Python 基础入门 Day39：Pandas 数据可视化初探

Python 基础入门 Day40：自动化办公基础 —— 操作 Excel 文件（openpyxl）

Python 基础入门 Day41：异常处理（Exception Handling）基础与实践

Python 多线程与多进程：并发编程避坑指南与性能对比

Python 并发编程的基石

什么是并发与并行？

Python GIL (Global Interpreter Lock)

Python 多线程 (Threading)

工作原理

使用场景

优势

避坑指南

Python 多进程 (Multiprocessing)

工作原理

使用场景

优势

避坑指南

性能对比与选择策略

最佳实践与进阶话题

使用 concurrent.futures 简化并发编程

协程 (asyncio) 简介

监控与调试并发程序

总结

使用 `concurrent.futures` 简化并发编程

协程 (`asyncio`) 简介