Python 文件路径操作的艺术：告别 os.path，拥抱 pathlib 的优雅之道

97次阅读

共计 7557 个字符，预计需要花费 19 分钟才能阅读完成。

前阵子帮新同事审查代码，发现他还在用 os.path.join 拼接路径，处理文件是否存在、是文件还是目录时，又得回到 os.path.exists 和 os.path.isfile。尤其当项目需要在 Windows 和 Linux 之间切换时，路径分隔符的问题更是让人头疼。我记得刚入行时也踩过类似的坑，那时候 Python 还没有 pathlib。今天，咱们就来彻底搞定文件路径操作，让你的代码在任何操作系统下都游刃有余，并且可读性提升好几个档次。

大家在处理文件路径时，我个人强烈推荐使用 pathlib，它能让你的代码更清晰、更健壮。pathlib 模块提供了一个 Path 对象，它不是简单的字符串，而是一个包含了路径所有操作的对象。

创建 Path 对象非常简单，你可以直接传入路径字符串：

from pathlib import Path

# 创建一个绝对路径对象
absolute_path = Path('/Users/your_name/documents/my_project/data.txt')
print(f"绝对路径: {absolute_path}")
# 小提醒：在 Windows 上，你也可以直接写成 Path('C:/Users/your_name/...')
# pathlib 会自动处理路径分隔符，所以你不用担心是 '/' 还是 ''。# 我刚开始用时总是担心要写成双反斜杠，后来发现 pathlib 足够智能，直接用正斜杠最方便。# 创建一个相对路径对象
relative_path = Path('my_project/data.txt')
print(f"相对路径: {relative_path}")

# 获取当前工作目录
current_dir = Path.cwd()
print(f"当前工作目录: {current_dir}")

# 获取用户主目录
home_dir = Path.home()
print(f"用户主目录: {home_dir}")

# 这里加 str() 是为了展示，Path 对象在大多数需要字符串的地方可以直接使用。# 比如 print() 函数，或者文件操作函数。

Path 对象就像一个智能容器，它知道自己是路径，并且内置了所有与路径相关的操作方法。

在使用 os.path 时，拼接路径我们通常用 os.path.join()。但 pathlib 提供了一种更优雅、更符合直觉的方式：使用 / 运算符。

第一步：用 `/` 运算符拼接路径

这简直是 pathlib 最令人拍案叫绝的特性之一。你可以像操作字符串一样，用 / 将 Path 对象和字符串拼接起来，生成新的 Path 对象。

from pathlib import Path

base_dir = Path('/home/user/my_app') # 假设在 Linux 环境下
config_file = base_dir / 'config' / 'app.ini'
print(f"拼接后的路径: {config_file}")
# 这里的 config_file 会是 /home/user/my_app/config/app.ini
# 如果在 Windows 上，base_dir 会是类似 C:Usersusermy_app，# 那么 config_file 就会自动变成 C:Usersusermy_appconfigapp.ini。# 简直是跨平台福音！我之前做跨平台工具，每次都得写 if os.name == 'nt' then join with backslash else with slash，有了 pathlib 直接省事一半。# 你也可以连续拼接
data_dir = Path('data')
report_path = base_dir / data_dir / 'reports' / 'summary.csv'
print(f"更复杂的拼接: {report_path}")

小提醒：Path 对象与字符串拼接时，永远以 Path 对象为主导，保证结果仍然是一个 Path 对象。这解决了 os.path.join 忘记传入路径参数的尴尬。

Path 对象提供了丰富的属性，让你轻松获取路径的各个部分，而不用再用 os.path.split 或 os.path.splitext 进行繁琐的字符串处理。

from pathlib import Path

file_path = Path('/home/user/documents/report.2023.pdf')

print(f"文件名 (带扩展名): {file_path.name}") # report.2023.pdf
print(f"文件名 (不带扩展名): {file_path.stem}") # report.2023
print(f"扩展名: {file_path.suffix}") # .pdf
print(f"上级目录: {file_path.parent}") # /home/user/documents
print(f"所有上级目录 (Path 对象列表): {file_path.parents}")
# 之前我需要一层层 split 再用 os.path.dirname 才能获取到，现在直接 .parents 就能得到一个迭代器，非常方便做向上查找。print(f"路径的各个部分 (元组): {file_path.parts}")
# ('/', 'home', 'user', 'documents', 'report.2023.pdf')

# 你还可以修改扩展名，生成新的 Path 对象
new_path = file_path.with_suffix('.txt')
print(f"修改扩展名后: {new_path}") # /home/user/documents/report.2023.txt
# 我在处理批量文件格式转换时，这个功能简直是神器，一行代码搞定。

小提醒：parents 属性返回的是一个迭代器，可以方便地遍历所有上级目录，这在需要向上追溯查找配置文件或根目录时特别有用。

pathlib 将文件系统的操作方法直接集成到了 Path 对象上，这使得代码逻辑更清晰，也更面向对象。

在对文件进行读写操作前，通常需要判断它是否存在。

from pathlib import Path

# 假设我们在当前目录下创建一个临时文件和目录
temp_dir = Path('temp_data')
temp_file = temp_dir / 'test.log'

temp_dir.mkdir(exist_ok=True) # 创建目录，如果已存在则不报错
# 这里加 exist_ok=True 是因为我之前写脚本，如果目录已经存在，# 再次运行就会抛 FileExistsError，导致脚本中断，踩过坑才知道要加上它。temp_file.touch() # 创建一个空文件
# touch() 比 open('w') 再 close() 更简洁，用来确保文件存在。print(f"'{temp_dir}' 是否存在: {temp_dir.exists()}") # True
print(f"'{temp_dir}' 是目录吗: {temp_dir.is_dir()}") # True
print(f"'{temp_dir}' 是文件吗: {temp_dir.is_file()}") # False

print(f"'{temp_file}' 是否存在: {temp_file.exists()}") # True
print(f"'{temp_file}' 是目录吗: {temp_file.is_dir()}") # False
print(f"'{temp_file}' 是文件吗: {temp_file.is_file()}") # True

# 路径是否是绝对路径
print(f"'{temp_file}' 是绝对路径吗: {temp_file.is_absolute()}") # False
print(f"'{temp_file.resolve()}' 是绝对路径吗: {temp_file.resolve().is_absolute()}") # True
# .resolve() 可以获取路径的绝对路径，并解析其中的符号链接。# 刚开始我不知道 .resolve()，总是手动拼接 cwd()，后来发现这个方法更可靠。

小提醒：is_symlink(), is_mount(), is_block_device() 等方法也提供了更多判断类型。

pathlib 使得文件内容读写变得异常简洁，无需手动 open() 和 close()。

from pathlib import Path

my_dir = Path('my_data')
my_dir.mkdir(exist_ok=True) # 创建目录

file_to_write = my_dir / 'my_note.txt'
# 写入文本内容
file_to_write.write_text('Hello, pathlib!nThis is a test.')
# 我写爬虫的时候，习惯把抓取到的 JSON 数据直接用 write_text 存起来，# 配合 read_text 读取，非常方便，不用管文件的打开关闭。# 读取文本内容
content = file_to_write.read_text()
print(f"n 读取到的内容:n{content}")

# 写入二进制内容 (比如图片)
image_file = my_dir / 'image.bin'
dummy_bytes = b'x01x02x03x04'
image_file.write_bytes(dummy_bytes)

# 读取二进制内容
read_bytes = image_file.read_bytes()
print(f"读取到的二进制内容: {read_bytes}")

# 重命名文件
new_file_name = my_dir / 'updated_note.txt'
file_to_write.rename(new_file_name)
print(f"文件已重命名为: {new_file_name.name}")
# 注意：rename 如果目标文件已存在会报错，如果你想覆盖，可以用 replace()。# 我之前就因为这个导致脚本中断过，后来发现 replace() 更适合需要强制覆盖的场景。# 移动文件 (实际上也是 rename 操作)
moved_file_path = Path('another_dir') / 'final_note.txt'
Path('another_dir').mkdir(exist_ok=True)
new_file_name.rename(moved_file_path) # 也可以是 .replace()
print(f"文件已移动到: {moved_file_path}")

# 我试过好几种移动文件的方式，发现 Path().rename() 是最简洁的。# 咱们用 shutil.move 也可以，但如果只是简单的路径内部移动或重命名，# pathlib 自己的方法就够了。

小提醒：write_text() 和 read_text() 默认使用系统编码，如果处理的文件编码不是默认的，记得加上 encoding='utf-8' 等参数，避免乱码。

pathlib 提供了 iterdir(), glob(), rglob() 等方法，可以方便地遍历和查找文件。

from pathlib import Path
import time

# 确保有测试数据
test_base = Path('test_data_search')
test_base.mkdir(exist_ok=True)
(test_base / 'file1.txt').touch()
(test_base / 'file2.log').touch()
(test_base / 'sub_dir').mkdir(exist_ok=True)
(test_base / 'sub_dir' / 'file3.txt').touch()
(test_base / 'sub_dir' / 'deep_dir').mkdir(exist_ok=True)
(test_base / 'sub_dir' / 'deep_dir' / 'config.ini').touch()

# 1. 遍历当前目录下的所有文件和目录 (不递归)
print("n--- iterdir() 遍历当前目录 ---")
for item in test_base.iterdir():
    print(item)
# 这里的 item 也是 Path 对象，你可以继续调用 item.is_file(), item.name 等。# 我经常用它来快速查看一个目录下有什么文件，比 ls 命令在脚本里处理输出方便多了。# 2. 使用 glob() 查找文件 (支持通配符，不递归)
print("n--- glob() 查找 .txt 文件 ---")
for txt_file in test_base.glob('*.txt'):
    print(txt_file)
# 类似于 shell 里的 glob 模式，非常实用。# 3. 使用 rglob() 递归查找文件 (支持通配符，递归)
print("n--- rglob() 递归查找所有 .txt 和 .ini 文件 ---")
for file in test_base.rglob('*.txt'):
    print(file)
for file in test_base.rglob('*.ini'):
    print(file)
# rglob 简直是我的最爱，写一些数据清理或文件整理脚本时，# 想在某个目录下把所有子目录里的特定类型文件找出来，一行代码就搞定，# 不用再写 os.walk 那样冗长的递归逻辑了。# 清理测试数据
time.sleep(0.1) # 等待文件系统操作完成
import shutil
shutil.rmtree(test_base) # 删除非空目录，pathlib 不直接提供，需要借助 shutil
Path('another_dir').rmdir() # 删除空目录

小提醒：glob() 只在当前 Path 对象表示的目录下查找，rglob() 则会递归地查找所有子目录。根据你的需求选择合适的查找方式。

尽管 pathlib 强大且优雅，但在使用过程中，新手们还是容易犯一些错误。这里我总结了几个我或同事们亲身经历过的“坑”，希望能帮助大家避开。

很多初学者在使用 pathlib 时，仍然会习惯性地把它当作普通字符串来操作，或者在不必要的地方进行类型转换。

错误示例：

p = Path('my_file.txt')
# 尝试用字符串方法替换
# print(p.replace('.txt', '.log')) # 报错：AttributeError: 'PosixPath' object has no attribute 'replace'

Path 对象是对象，它有自己的方法，而不是字符串的方法。如果你需要修改扩展名，应该使用 p.with_suffix('.log')。

我的经验：
我刚开始用 pathlib 时，总是习惯性地在需要字符串作为参数的函数前加上 str(path_obj)。后来才发现，Python 生态圈中很多接受文件路径作为参数的函数（如 open(), shutil 模块的大多数函数），都能直接接受 Path 对象，它会自动在内部转换为字符串。所以，不要过度转换，让 Path 对象发挥它的作用。

相对路径是相对于程序运行时的“当前工作目录”（Current Working Directory, CWD），而不是脚本文件本身的目录。这在调试和部署时常常让人困惑。

踩坑经历：
有一次我写了个脚本，里面用 Path('data/config.json') 来读取配置文件。在 PyCharm 里运行一切正常，因为 PyCharm 默认以项目根目录作为 CWD。但当我把脚本放到服务器上，用 python my_script.py 运行，结果就报 FileNotFoundError。排查了很久才发现，服务器上脚本的 CWD 是 /home/user/，而不是脚本所在的 /home/user/my_app/。

正确做法：
如果你想获取脚本文件所在的目录，然后基于此构建路径，应该这样做：

import sys
from pathlib import Path

# 获取当前脚本文件的绝对路径
script_path = Path(__file__).resolve()
# 获取脚本文件所在的目录
script_dir = script_path.parent

config_file_path = script_dir / 'data' / 'config.json'
print(f"配置文件路径: {config_file_path}")
# 这样无论脚本在哪里运行，都能找到相对于自身的文件。

小提醒：Path(__file__).resolve() 能够正确处理符号链接的情况，确保你拿到的是真实的脚本路径。

Path.rmdir() 方法只能删除 空目录。如果你想删除一个非空的目录，会收到 OSError 错误。

我的经验：
一次写清理脚本，想递归删除一个临时目录，结果用了 Path.rmdir()，发现报 OSError: [Errno 39] Directory not empty。后来才想起，Path 模块本身没有提供类似 rm -rf 的功能。对于非空目录的删除，我们需要借助 shutil 模块。

正确做法：

import shutil
from pathlib import Path

temp_dir = Path('my_temp_dir_to_delete')
temp_dir.mkdir(exist_ok=True)
(temp_dir / 'some_file.txt').touch()

# 尝试用 rmdir 会报错
try:
    temp_dir.rmdir()
except OSError as e:
    print(f"错误: {e}") # 会提示目录非空

# 正确删除非空目录的方法
shutil.rmtree(temp_dir)
print(f"'{temp_dir}' 已被彻底删除。")

小提醒：shutil.rmtree() 是一个非常强大的功能，但也要谨慎使用，因为它会不加提示地删除目录及其所有内容，操作前务必确认路径无误。

pathlib 模块是 Python 在文件路径操作方面的一次重大升级，它以面向对象的方式，极大地简化了路径的拼接、解析和文件系统的交互。通过 Path 对象，你的代码将变得更具可读性、更健壮，并且天生支持跨平台。从今天起，告别 os.path 的字符串迷宫，拥抱 pathlib 带来的优雅与便捷吧！

如果你也用 pathlib 踩过什么有意思的坑，或者有什么独家使用技巧，欢迎在评论区分享，咱们一起交流！

正文完

os.path替代 pathlib Python路径操作文件系统跨平台

发表至： Python

2025-11-08

0

Python基础入门 Day92 JSON数据的读取与写入

深度解析 Python 异常处理最佳实践：高效的 try-except 设计与日志记录策略

Python 操作 xls 表：高效提取与转移

Streamlit 实战：基于 Python 快速搭建交互式数据可视化应用，解锁数据洞察力与交互图表精髓

Python 高效处理复杂 JSON 数据：`jsonpath` 库实战指南

Python 文件路径操作的艺术：告别 os.path，拥抱 pathlib 的优雅之道

告别字符串：创建 Path 对象

智能导航：路径的拼接与解析

第一步：用 `/` 运算符拼接路径

第二步：解析路径组成部分

文件与目录操作：不再迷茫

第一步：检查文件或目录是否存在及类型

第二步：创建、读写与移动文件 / 目录

第三步：查找文件与目录

常见误区与避坑指南

误区一：混淆 Path 对象与字符串

误区二：相对路径的陷阱——当前工作目录

误区三：删除目录不小心删掉文件

经验总结

Playwright page.goto(url) 详解：深入解析网页导航的最佳实践

如何在安卓 Termux 上安装 qBittorrent

深度解析：基于 PyTorch 实现图像分类——从数据集构建到模型训练部署全攻略

Python 基础入门 Day30

如何使用Python实现高效的数据筛选和处理：一步步带你掌握列表解析与生成器

如何在Mac上高效使用Terminal：5个实用命令

如何用 Python 批量重命名文件：一步一步的教程

如何用Python爬虫自动化下载网页数据：从入门到精通

Mac 文件管理技巧：如何利用 Spotlight 快速查找文件

Python 性能优化：提升代码执行效率的五个技巧

Python 文件路径操作的艺术：告别 os.path，拥抱 pathlib 的优雅之道

告别字符串：创建 Path 对象

智能导航：路径的拼接与解析

第一步：用 / 运算符拼接路径

第二步：解析路径组成部分

文件与目录操作：不再迷茫

第一步：检查文件或目录是否存在及类型

第二步：创建、读写与移动文件 / 目录

第三步：查找文件与目录

常见误区与避坑指南

误区一：混淆 Path 对象与字符串

误区二：相对路径的陷阱——当前工作目录

误区三：删除目录不小心删掉文件

经验总结

第一步：用 `/` 运算符拼接路径