Python 操作 Redis 缓存：数据存储与分布式锁实现深度解析

204次阅读

共计 10176 个字符，预计需要花费 26 分钟才能阅读完成。

在当今高性能、高并发的应用场景中，如何高效地处理数据存储和确保系统在分布式环境下的数据一致性，是每一个开发者都必须面对的挑战。Redis，作为一个开源的、高性能的键值对内存数据库，以其闪电般的速度和丰富的数据结构，成为了缓存、消息队列、实时统计等众多领域的首选工具。而 Python，作为一门简洁、强大的脚本语言，与 Redis 的结合更是如虎添翼，能够帮助开发者快速构建出稳定、高效的应用。

本文将深入探讨如何使用 Python 来操作 Redis，不仅涵盖了 Redis 作为高性能缓存的数据存储策略，还将详细解析并实现基于 Redis 的分布式锁，帮助读者全面理解和掌握在 Python 项目中驾驭 Redis 的精髓。

在深入 Python 操作 Redis 之前，我们首先需要理解 Redis 为何如此受到青睐。Redis 全称 Remote Dictionary Server，是一个使用 ANSI C 编写的开源、高性能的键值对存储系统，通常被称为数据结构服务器。

内存数据库：Redis 将数据存储在内存中，这使得它能够提供极低的读写延迟，速度远超传统的磁盘数据库。
丰富的数据结构：Redis 不仅仅支持简单的键值对（字符串），还内置了哈希（Hash）、列表（List）、集合（Set）、有序集合（Sorted Set）等多种高级数据结构，极大地扩展了其应用场景。
持久化：尽管是内存数据库，Redis 也提供了 RDB（Redis Database）和 AOF（Append Only File）两种持久化机制，可以将内存中的数据写入磁盘，防止数据丢失。
原子性操作：Redis 的所有操作都是原子性的，这意味着即使多个客户端同时对同一键进行操作，也能保证数据的一致性和完整性。
发布 / 订阅模式：支持发布 / 订阅功能，可以构建实时消息系统。
事务支持：支持 MULTI、EXEC 等命令实现简单的事务操作。

将 Redis 用作缓存，是其最常见的应用场景之一。其优势显而易见：

极速响应：数据从内存读取，响应时间通常在毫秒级甚至微秒级。
减轻数据库压力：热点数据存储在缓存中，可以大幅减少对后端数据库的访问，提高系统整体吞吐量。
灵活的过期策略：可以为缓存数据设置过期时间（TTL），实现数据的自动淘汰，避免存储过时或无效数据。
高并发支持：Redis 单线程模型避免了多线程的上下文切换开销，同时通过 I / O 多路复用技术，能够处理大量并发请求。

要使用 Python 操作 Redis，首先需要安装 redis-py 库。

安装 `redis-py`

pip install redis

redis-py提供了 Redis 类用于连接和操作 Redis 服务器。

import redis

# 连接本地 Redis 服务器 (默认端口 6379, 数据库 0)
# host 参数指定 Redis 服务器的 IP 地址或主机名
# port 参数指定 Redis 服务器的端口
# db 参数指定要使用的数据库索引
# password 参数如果 Redis 设置了密码，则需要提供
try:
    r = redis.Redis(host='localhost', port=6379, db=0, password=None)
    # 尝试执行一个简单的操作来验证连接
    r.ping()
    print("成功连接到 Redis 服务器！")
except redis.exceptions.ConnectionError as e:
    print(f"无法连接到 Redis 服务器: {e}")
except redis.exceptions.AuthenticationError as e:
    print(f"Redis 认证失败: {e}")

redis-py库将 Redis 的每种数据结构操作都封装成了对应的方法。

字符串是 Redis 最基本的数据类型，可以存储文本、数字等。

# 设置键值
r.set('mykey', 'Hello Redis from Python')
r.set('user:1:name', 'Alice')
r.set('view_count', 100)

# 获取键值
print(f"mykey 的值: {r.get('mykey').decode('utf-8')}")
print(f"user:1:name 的值: {r.get('user:1:name').decode('utf-8')}")

# 对数字进行增减操作
r.incr('view_count') # 增加 1
r.decr('view_count', 5) # 减少 5
print(f"view_count 的值: {r.get('view_count').decode('utf-8')}")

# 设置带过期时间的键
r.setex('temp_key', 60, 'This will expire in 60 seconds') # 60 秒后过期
print(f"temp_key 的值: {r.get('temp_key').decode('utf-8')}")

哈希表适用于存储对象，可以视为一个键值对的集合。

# 存储用户信息
r.hset('user:2', mapping={
    'name': 'Bob',
    'email': '[email protected]',
    'age': 30
})

# 获取单个字段
print(f"user:2 的 name: {r.hget('user:2','name').decode('utf-8')}")

# 获取所有字段
user_info = r.hgetall('user:2')
print("user:2 的所有信息:")
for field, value in user_info.items():
    print(f"{field.decode('utf-8')}: {value.decode('utf-8')}")

列表是一个有序的字符串集合，可以作为队列或栈使用。

# 左侧插入元素
r.lpush('task_queue', 'task_A', 'task_B')
# 右侧插入元素
r.rpush('task_queue', 'task_C')

# 从右侧取出元素 (作为队列)
print(f"从右侧取出: {r.rpop('task_queue').decode('utf-8')}")
# 从左侧取出元素 (作为栈或处理队列)
print(f"从左侧取出: {r.lpop('task_queue').decode('utf-8')}")

# 获取列表所有元素
all_tasks = r.lrange('task_queue', 0, -1)
print("剩余任务:")
for task in all_tasks:
    print(f"{task.decode('utf-8')}")

集合是一个无序的、不重复的字符串集合，常用于存储唯一标签、好友列表等。

# 添加元素
r.sadd('tags:article:101', 'Python', 'Redis', 'Cache')
r.sadd('tags:article:102', 'Python', 'AI', 'Machine Learning')

# 获取所有元素
print(f"文章 101 的标签: {[tag.decode('utf-8') for tag in r.smembers('tags:article:101')]}")

# 集合交集 (共同标签)
common_tags = r.sinter('tags:article:101', 'tags:article:102')
print(f"文章 101 和 102 的共同标签: {[tag.decode('utf-8') for tag in common_tags]}")

有序集合是集合的变体，每个成员都关联一个分数（score），通过分数进行排序。常用于排行榜。

# 添加成员及分数
r.zadd('game_ranking', mapping={'player1': 100, 'player2': 150, 'player3': 120})
r.zadd('game_ranking', mapping={'player4': 180}) # 添加新玩家
r.zincrby('game_ranking', 20, 'player1') # 增加分数

# 获取排名靠前的玩家 (分数从高到低)
# ZRANGEBYSCORE 可以指定分数范围
top_players = r.zrevrange('game_ranking', 0, 1, withscores=True) # 前 2 名
print("游戏排行榜前 2 名:")
for player, score in top_players:
    print(f"{player.decode('utf-8')}: {int(score)}")

# 获取某个成员的排名
print(f"player2 的排名: {r.zrank('game_ranking','player2')}") # 0 表示第一名，这里是升序
print(f"player2 的逆序排名: {r.zrevrank('game_ranking','player2')}") # 0 表示第一名，这里是降序

当需要执行大量 Redis 命令时，可以使用管道（Pipeline）来减少网络往返时间（RTT），提高效率。管道允许客户端一次性发送多个命令给服务器，然后一次性接收所有命令的回复。

pipe = r.pipeline()
pipe.set('key1', 'value1')
pipe.set('key2', 'value2')
pipe.get('key1')
pipe.incr('view_count')
results = pipe.execute()
print(f"管道执行结果: {results}")

Redis 的事务（Transaction）通过 MULTI 和EXEC命令实现，它将一系列命令打包，确保这些命令作为一个原子操作被执行，即要么全部成功，要么全部失败。redis-py的管道对象默认就支持事务。

# 使用管道实现事务
# 事务可以保证原子性，即使有其他客户端在 MULTI 和 EXEC 之间修改了数据，事务也会尝试执行
# 但请注意，Redis 事务的原子性与传统数据库 ACID 事务有所不同，它不具备回滚能力
pipe = r.pipeline()
pipe.multi() # 开启事务
pipe.set('balance:user:100', 1000)
pipe.incrby('balance:user:100', -200) # 扣减 200
pipe.incrby('balance:user:200', 200) # 增加 200
pipe.exec() # 提交事务
print(f"用户 100 余额: {r.get('balance:user:100').decode('utf-8')}")

在分布式系统中，为了保证共享资源在并发访问时的数据一致性，分布式锁是必不可少的机制。Redis 凭借其高性能、原子操作和支持过期时间的特性，成为实现分布式锁的理想选择。

分布式锁是一种在分布式环境下协调多个进程访问共享资源的方法。它的核心目标是：在任意时刻，只有一个客户端能持有锁，从而访问共享资源。

死锁：如果获取锁的客户端在释放锁之前崩溃，或者网络中断，导致锁无法被释放，可能造成死锁。
误删：客户端 A 获取锁后，因业务逻辑执行时间过长导致锁过期。此时客户端 B 获取了锁。随后客户端 A 执行完毕，错误地释放了客户端 B 持有的锁。
并发安全性：如何确保在多进程或多线程环境下，获取锁和释放锁的操作是原子且安全的。
单点故障：如果锁服务（如单个 Redis 实例）崩溃，可能导致所有依赖锁的服务不可用或产生数据不一致。

Redis 分布式锁的实现主要依赖于 SETNX（SET if Not eXists）命令以及过期时间。现代 Redis 版本推荐使用SET 命令的扩展选项，因为它能原子性地完成 SETNX 和EXPIRE的操作，避免了竞态条件。

核心思想：

加锁：客户端尝试向 Redis 设置一个带有唯一标识符的键，并指定过期时间。只有当键不存在时，设置操作才能成功，表示获取到锁。
SET key_name random_value EX expiry_time NX
- key_name: 锁的唯一标识。
- random_value: 客户端的唯一标识（如 UUID），用于防止误删。
- EX expiry_time: 锁的过期时间，单位秒，防止死锁。
- NX: Not eXists，只有当键不存在时才设置成功。
解锁：客户端在业务逻辑完成后，检查当前锁的random_value 是否与自己设置的相同，如果相同则删除键，释放锁。这个“检查 + 删除”必须是原子操作，通常通过 Lua 脚本实现。

我们可以封装一个 DistributedLock 类来实现上述逻辑。

import redis
import uuid
import time

class DistributedLock:
    def __init__(self, redis_client, lock_name, expire_time=10):
        """
        初始化分布式锁。:param redis_client: redis.Redis 客户端实例。:param lock_name: 锁的名称（Redis 中的键名）。:param expire_time: 锁的过期时间，单位秒，防止死锁。"""
        self.redis_client = redis_client
        self.lock_name = lock_name
        self.expire_time = expire_time
        self.identifier = str(uuid.uuid4()) # 客户端唯一标识，用于防止误删

    def acquire(self, block=False, timeout=None, interval=0.1):
        """
        尝试获取锁。:param block: 是否阻塞。如果为 True，则在超时前一直尝试获取锁。:param timeout: 阻塞模式下，等待锁的超时时间（秒）。:param interval: 阻塞模式下，每次尝试获取锁的间隔时间（秒）。:return: True 如果成功获取锁，False 否则。"""
        if not block:
            return self._try_acquire()

        end_time = time.time() + (timeout if timeout is not None else float('inf'))
        while time.time() < end_time:
            if self._try_acquire():
                return True
            time.sleep(interval)
        return False

    def _try_acquire(self):
        """非阻塞方式尝试获取锁。"""
        # SET 命令的 NX 选项确保只有当 key 不存在时才能设置成功
        # EX 选项设置 key 的过期时间，防止死锁
        # value 使用唯一标识，防止误删
        # 返回 True 表示成功获取锁，False 表示未获取到
        return self.redis_client.set(self.lock_name, self.identifier, ex=self.expire_time, nx=True)

    def release(self):
        """
        释放锁。只有当锁的 value 与当前客户端的 identifier 匹配时才释放，防止误删。通过 Lua 脚本保证检查和删除的原子性。:return: True 如果成功释放锁，False 否则。"""
        # Lua 脚本的原子性确保了：检查锁的拥有者和删除锁这两个操作不会被中断
        # script = """#     if redis.call("get", KEYS[1]) == ARGV[1] then
        #         return redis.call("del", KEYS[1])
        #     else
        #         return 0
        #     end
        # """
        # KEYS[1] 是 lock_name, ARGV[1] 是 identifier
        # r.eval(script, num_keys, *keys, *args)
        # return self.redis_client.eval(script, 1, self.lock_name, self.identifier)

        # redis-py 提供了 context manager (with Lock(...))，简化了锁的获取和释放
        # 但手动实现时，需要确保检查和删除的原子性
        # 如果使用 redis-py 的 Lock 模块，会更简洁

        # 简化版实现，不保证 100% 原子性（但在 Python 中，通常由库封装好的方法来处理）# 正确的做法是使用 Lua 脚本，或者 redis-py 内置的 Lock/Redlock 模块
        # 为了演示原理，此处先用 get 和 delete 分开演示，实际生产应使用原子操作

        # 以下是原子释放锁的 Lua 脚本实现
        lua_script = """if redis.call('get', KEYS[1]) == ARGV[1] then
                return redis.call('del', KEYS[1])
            else
                return 0
            end
        """

        # eval 方法执行 Lua 脚本，KEYS 参数传递 key，ARGV 参数传递 value
        return self.redis_client.eval(lua_script, 1, self.lock_name, self.identifier) == 1

    def __enter__(self):
        """上下文管理器入口"""
        if not self.acquire(block=True, timeout=30): # 默认阻塞获取，超时 30 秒
            raise RuntimeError(f"Failed to acquire lock {self.lock_name}")
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        """上下文管理器出口"""
        self.release()

# 示例使用
if __name__ == "__main__":
    r_client = redis.Redis(host='localhost', port=6379, db=0)

    lock_key = "my_resource_lock"

    # 使用 with 语句 (推荐)
    try:
        with DistributedLock(r_client, lock_key, expire_time=5) as lock:
            print(f"进程 {lock.identifier} 成功获取到锁。开始执行业务逻辑...")
            # 模拟业务逻辑
            time.sleep(2) 
            print(f"进程 {lock.identifier} 业务逻辑执行完毕。")
        print(f"进程 {lock.identifier} 锁已释放。")
    except RuntimeError as e:
        print(e)
    except Exception as e:
        print(f"发生错误: {e}")

    # 尝试再次获取锁（非阻塞模式）lock2 = DistributedLock(r_client, lock_key, expire_time=5)
    if lock2.acquire(block=False):
        print(f"进程 {lock2.identifier} 成功获取到锁。")
        lock2.release()
        print(f"进程 {lock2.identifier} 释放锁。")
    else:
        print(f"进程 {lock2.identifier} 未能获取到锁。")

    # 模拟一个长时间运行的任务，然后被另一个进程尝试获取锁
    print("n--- 模拟长时间任务与锁竞争 ---")
    lock3 = DistributedLock(r_client, "long_task_lock", expire_time=3)
    if lock3.acquire(): # 默认阻塞，但默认超时是 None，所以会一直等
        print(f"进程 {lock3.identifier} 获取到锁'long_task_lock'。开始长时间任务...")
        time.sleep(4) # 任务时间长于锁过期时间
        print(f"进程 {lock3.identifier} 任务执行完毕。尝试释放锁。")
        # 此时锁可能已经过期并被其他进程获取
        if lock3.release():
            print(f"进程 {lock3.identifier} 成功释放锁'long_task_lock'。")
        else:
            print(f"进程 {lock3.identifier} 释放锁'long_task_lock'失败，可能已被其他进程获取或过期。")
    else:
        print(f"进程 {lock3.identifier} 未能获取到锁'long_task_lock'。")

    # 另一个进程尝试获取锁
    lock4 = DistributedLock(r_client, "long_task_lock", expire_time=3)
    if lock4.acquire(block=True, timeout=1): # 阻塞 1 秒
        print(f"进程 {lock4.identifier} 在竞争中获取到锁'long_task_lock'。")
        lock4.release()
    else:
        print(f"进程 {lock4.identifier} 未能在 1 秒内获取到锁'long_task_lock'。")

关于 Redlock 算法：

上述实现是基于单 Redis 实例的分布式锁。在生产环境中，如果 Redis 实例发生故障，可能会影响锁的可用性。为了解决单点故障问题，Redis 官方提出了 Redlock 算法。Redlock 需要多个独立的 Redis Master 节点，客户端尝试在 N /2+ 1 个节点上获取锁才能算作成功。它的实现相对复杂，主要用于对可用性和安全性要求极高的场景。对于大多数应用而言，单个 Redis 实例的分布式锁配合良好的监控和故障转移机制通常已足够。

使用 Redis 作为缓存和分布式锁时，还需要考虑一些优化和潜在问题。

缓存穿透：查询一个不存在的数据，每次都去数据库查询，导致数据库压力过大。
- 解决方案：布隆过滤器（Bloom Filter）预先过滤掉不存在的键；将空值也缓存起来，并设置较短的过期时间。
缓存击穿：某个热点数据突然失效，大量请求同时涌入数据库。
- 解决方案：设置热点数据永不过期；加锁，使得只有一个请求去重建缓存，其他请求等待；使用互斥锁来限制并发访问数据库。
缓存雪崩：大量缓存数据在同一时间失效，所有请求都涌向数据库。
- 解决方案：将缓存的过期时间错开，增加随机性；采用多级缓存；服务熔断和降级。

RDB (Snapshotting)：定期将内存中的数据快照写入磁盘。恢复速度快，但可能丢失最后一次快照之后的数据。适用于数据可靠性要求不高，或可接受少量数据丢失的场景。
AOF (Append Only File)：以日志形式记录所有写操作。数据安全性更高，丢失数据可能性小，但文件通常比 RDB 大，恢复速度相对慢。适用于对数据可靠性要求高的场景。
混合持久化：Redis 4.0 以后支持，RDB 和 AOF 结合使用，兼顾了恢复速度和数据安全性。

Redis 是内存数据库，合理管理内存至关重要：

设置maxmemory：限制 Redis 使用的最大内存量。
选择淘汰策略 ：当内存达到maxmemory 时，Redis 会根据配置的策略（如 allkeys-lru、volatile-ttl 等）淘汰键。
大键 (BigKey) 问题：避免存储过大的键（如几十 MB 的字符串、包含百万元素的列表），这会影响 Redis 性能和内存碎片。

频繁地创建和关闭 Redis 连接会消耗系统资源并增加延迟。redis-py默认使用连接池，它会维护一定数量的连接，并在需要时重用它们，从而提高性能。

import redis
# 连接池默认配置
pool = redis.ConnectionPool(host='localhost', port=6379, db=0)
r = redis.Redis(connection_pool=pool)
# 之后的所有 r.set(), r.get()等操作都会从连接池获取连接

设置密码 ：通过requirepass 配置 Redis 访问密码。
网络隔离：将 Redis 部署在内网，避免直接暴露在公网。
最小权限原则：仅授予应用所需的最小权限。

通过本文的深入探讨，我们全面了解了如何使用 Python 与 Redis 进行交互，从基本的数据存储到复杂的分布式锁实现。Redis 作为高性能缓存和数据存储的利器，结合 Python 的简洁与高效，能够帮助开发者构建出响应迅速、高并发、数据一致性强的现代应用。

无论是优化数据库性能、构建实时排行榜、实现消息队列，还是确保分布式系统的数据安全，Redis 都能提供强大的支持。掌握 Python 操作 Redis 的技能，无疑将为你的开发工作增添一枚重要的筹码。希望本文能为你提供有价值的指导和实践经验，助你在 Redis 的世界里游刃有余。

正文完

发表至： Python

2026-01-01

0

Python基础入门 Day91 单元测试与代码质量保证

用 Python 处理 JSON/XML 数据：高效解析与格式转换

告别零散！Flask RESTful API 完整项目结构与多层权限控制实践

Python 基础入门 Day14

Python ORM 进阶：SQLAlchemy 的高级查询、事务管理与最佳实践

Python 操作 Redis 缓存：数据存储与分布式锁实现深度解析

Redis 基础：为何选择它？

Redis 的核心特性

Redis 作为缓存的优势

Python 连接 Redis：环境搭建与基本操作

安装 `redis-py`

连接 Redis 服务器

基本数据类型操作示例

1. 字符串 (String)

2. 哈希 (Hash)

3. 列表 (List)

4. 集合 (Set)

5. 有序集合 (Sorted Set)

管道 (Pipelining) 与事务 (Transactions)

Redis 分布式锁：原理与 Python 实现

什么是分布式锁？

分布式锁面临的挑战

基于 Redis 的分布式锁基本实现原理

Python 实现分布式锁

优化与注意事项

1. 缓存穿透、击穿、雪崩

2. Redis 持久化选择

3. 内存管理

4. 连接池

5. 安全性

结语

Python 正则表达式完全指南：掌握复杂匹配，解锁高级数据处理能力 | 实战案例解析

隐藏 nodeloc等类似论坛广告和欢迎横幅油猴脚本

Python 基础入门 Day38：Flask 入门实践（一）搭建你的第一个 Web 应用

Python 基础入门 Day39：Pandas 数据可视化初探

Python 基础入门 Day40：自动化办公基础 —— 操作 Excel 文件（openpyxl）

Python 基础入门 Day41：异常处理（Exception Handling）基础与实践

💡Python图像处理实战：打造一个命令行图片尺寸调整工具（含完整源码）

Python 基础入门 Day42—— Python 文件与目录操作进阶技巧

Python 基础入门 Day43-Flask 框架快速搭建一个基础的 Web 应用

Python 基础入门 Day44-Python 多线程与多进程编程入门

Python 操作 Redis 缓存：数据存储与分布式锁实现深度解析

Redis 基础：为何选择它？

Redis 的核心特性

Redis 作为缓存的优势

Python 连接 Redis：环境搭建与基本操作

安装 redis-py

连接 Redis 服务器

基本数据类型操作示例

1. 字符串 (String)

2. 哈希 (Hash)

3. 列表 (List)

4. 集合 (Set)

5. 有序集合 (Sorted Set)

管道 (Pipelining) 与 事务 (Transactions)

Redis 分布式锁：原理与 Python 实现

什么是分布式锁？

分布式锁面临的挑战

基于 Redis 的分布式锁基本实现原理

Python 实现分布式锁

优化与注意事项

1. 缓存穿透、击穿、雪崩

2. Redis 持久化选择

3. 内存管理

4. 连接池

5. 安全性

结语

安装 `redis-py`

管道 (Pipelining) 与事务 (Transactions)