Python 数据结构与算法精讲：链表、栈、队列与经典排序算法实现指南

5次阅读

共计 5473 个字符，预计需要花费 14 分钟才能阅读完成。

在编程世界中，数据结构与算法（Data Structures and Algorithms, DSA）是构建高效、可扩展软件的基石。无论是处理海量数据、优化系统性能，还是在技术面试中脱颖而出，扎实掌握 DSA 都是不可或缺的能力。Python，作为一门以其简洁性和强大功能著称的语言，为我们学习和实现各种数据结构与算法提供了极佳的平台。

本文将深入探讨 Python 中几种核心的数据结构——链表、栈、队列，以及一系列经典的排序算法。我们将不仅仅是理解它们的理论概念，更重要的是通过 Python 代码实现它们，帮助你将理论知识转化为实际编程能力。

在深入具体的数据结构和算法之前，我们先来明确它们的定义：

数据结构 是组织、管理和存储数据的方式，以便有效地访问和修改。选择合适的数据结构能够极大地提升程序的效率。
算法则是解决特定问题的一系列明确的指令或步骤。一个好的算法能够在时间和空间上都达到最优解。

理解数据结构与算法不仅能让你写出更“好”的代码，还能提升你的逻辑思维和问题解决能力。

链表是一种线性数据结构，与数组不同，它在内存中不必是连续的。链表的每个元素（称为节点）都包含数据本身和一个指向下一个节点的引用（或指针）。这种结构使得链表在插入和删除操作上比数组更加高效。

链表主要分为：

单向链表 (Singly Linked List)：每个节点只包含指向下一个节点的引用。
双向链表 (Doubly Linked List)：每个节点包含指向前一个和后一个节点的引用。
循环链表 (Circular Linked List)：链表的最后一个节点指向第一个节点。

我们将以单向链表为例，展示其 Python 实现。

首先，我们需要定义一个 Node 类来表示链表中的每个节点，然后定义一个 LinkedList 类来管理这些节点。

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

class LinkedList:
    def __init__(self):
        self.head = None

    def append(self, data):
        """在链表末尾添加节点"""
        new_node = Node(data)
        if not self.head:
            self.head = new_node
            return
        last = self.head
        while last.next:
            last = last.next
        last.next = new_node

    def prepend(self, data):
        """在链表开头添加节点"""
        new_node = Node(data)
        new_node.next = self.head
        self.head = new_node

    def delete_node(self, key):
        """删除指定数据的节点"""
        current_node = self.head
        if current_node and current_node.data == key:
            self.head = current_node.next
            current_node = None
            return

        prev = None
        while current_node and current_node.data != key:
            prev = current_node
            current_node = current_node.next

        if current_node is None: # 如果没找到
            return

        prev.next = current_node.next
        current_node = None

    def display(self):
        """打印链表所有节点数据"""
        elements = []
        current = self.head
        while current:
            elements.append(current.data)
            current = current.next
        print("->".join(map(str, elements)))

# 示例使用
my_list = LinkedList()
my_list.append(1)
my_list.append(2)
my_list.append(3)
my_list.prepend(0)
my_list.display() # 输出: 0 -> 1 -> 2 -> 3

my_list.delete_node(2)
my_list.display() # 输出: 0 -> 1 -> 3

链表的优势在于其灵活的内存分配和高效的插入 / 删除操作，但缺点是访问元素需要从头开始遍历，因此随机访问效率较低。

栈是一种特殊的线性数据结构，它遵循“后进先出”（Last In, First Out, LIFO）的原则。你可以把它想象成一叠盘子，最后放上去的盘子总是最先被拿走。

栈主要支持两种基本操作：

压入 (Push)：将元素添加到栈的顶部。
弹出 (Pop)：从栈的顶部移除元素。

其他常见操作还包括 peek（查看栈顶元素但不移除）、isEmpty（检查栈是否为空）和 size（获取栈中元素数量）。

Python 的 list 类型已经提供了实现栈所需的所有功能 (append() 对应 Push，pop() 对应 Pop)。但为了更好的封装性和理解栈的特性，我们也可以自定义一个 Stack 类。

class Stack:
    def __init__(self):
        self.items = []

    def is_empty(self):
        """检查栈是否为空"""
        return len(self.items) == 0

    def push(self, item):
        """将元素压入栈顶"""
        self.items.append(item)

    def pop(self):
        """从栈顶弹出元素"""
        if self.is_empty():
            raise IndexError("pop from empty stack")
        return self.items.pop()

    def peek(self):
        """查看栈顶元素"""
        if self.is_empty():
            raise IndexError("peek from empty stack")
        return self.items[-1]

    def size(self):
        """获取栈中元素数量"""
        return len(self.items)

    def display(self):
        """打印栈中所有元素"""
        print(self.items)

# 示例使用
my_stack = Stack()
my_stack.push(10)
my_stack.push(20)
my_stack.push(30)
my_stack.display() # 输出: [10, 20, 30]

print(f"栈顶元素: {my_stack.peek()}") # 输出: 栈顶元素: 30
print(f"弹出元素: {my_stack.pop()}") # 输出: 弹出元素: 30
my_stack.display() # 输出: [10, 20]

栈在函数调用、表达式求值、浏览器历史记录等场景中都有广泛应用。

队列也是一种线性数据结构，但它遵循“先进先出”（First In, First Out, FIFO）的原则。你可以把它想象成排队买票的队伍，先来的人先获得服务。

队列主要支持两种基本操作：

入队 (Enqueue)：将元素添加到队列的尾部。
出队 (Dequeue)：从队列的头部移除元素。

其他操作类似栈，包括 peek（查看队头元素）、isEmpty 和 size。

与栈类似，Python 的 list 也可以用来实现队列，但使用 pop(0) 会导致 O(n) 的时间复杂度，因为每次弹出元素后都需要移动所有后续元素。更高效的方法是使用 collections 模块中的 deque（双端队列）。

from collections import deque

class Queue:
    def __init__(self):
        self.items = deque() # 使用 deque 实现

    def is_empty(self):
        """检查队列是否为空"""
        return len(self.items) == 0

    def enqueue(self, item):
        """将元素入队"""
        self.items.append(item)

    def dequeue(self):
        """将元素出队"""
        if self.is_empty():
            raise IndexError("dequeue from empty queue")
        return self.items.popleft() # 从左侧弹出

    def peek(self):
        """查看队头元素"""
        if self.is_empty():
            raise IndexError("peek from empty queue")
        return self.items[0]

    def size(self):
        """获取队列中元素数量"""
        return len(self.items)

    def display(self):
        """打印队列中所有元素"""
        print(list(self.items)) # 转换为列表以便打印

# 示例使用
my_queue = Queue()
my_queue.enqueue("A")
my_queue.enqueue("B")
my_queue.enqueue("C")
my_queue.display() # 输出: ['A', 'B', 'C']

print(f"队头元素: {my_queue.peek()}") # 输出: 队头元素: A
print(f"出队元素: {my_queue.dequeue()}") # 输出: 出队元素: A
my_queue.display() # 输出: ['B', 'C']

队列在任务调度、广度优先搜索 (BFS)、打印任务等场景中扮演着重要角色。

排序算法是将一组数据按照特定顺序（升序或降序）重新排列的算法。排序是计算机科学中最基本且最重要的操作之一，其效率对程序性能有着巨大影响。

常见的排序算法有：

简单排序 ：冒泡排序、选择排序、插入排序。它们通常易于理解和实现，但时间复杂度较高 (O(n^2))。
高级排序 ：归并排序、快速排序、堆排序。它们通常采用分治策略，时间复杂度更优 (O(n log n))。
非比较排序 ：计数排序、基数排序、桶排序。这类算法不通过比较元素来排序，对特定数据范围具有更优的性能。

我们将以冒泡排序为例，展示一个简单排序算法的 Python 实现。

冒泡排序（Bubble Sort）是一种简单直观的排序算法。它重复地遍历待排序的列表，一次比较两个相邻的元素，如果它们的顺序错误就交换它们。遍历列表的工作是重复地进行直到没有再需要交换，也就是说该列表已经排序完成。

def bubble_sort(arr):
    n = len(arr)
    # 遍历所有数组元素
    for i in range(n):
        # 优化: 如果一轮遍历没有发生交换，说明数组已经有序
        swapped = False
        # 最后 i 个元素已经排好序，不需要再次比较
        for j in range(0, n - i - 1):
            # 比较相邻元素
            if arr[j] > arr[j + 1]:
                # 交换位置
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
                swapped = True
        if not swapped:
            break
    return arr

# 示例使用
unsorted_list = [64, 34, 25, 12, 22, 11, 90]
print(f"原始列表: {unsorted_list}")
sorted_list = bubble_sort(unsorted_list)
print(f"冒泡排序后: {sorted_list}") # 输出: 冒泡排序后: [11, 12, 22, 25, 34, 64, 90]

冒泡排序的时间复杂度在最坏和平均情况下是 O(n^2)，在最好情况下（已经排序）是 O(n)，因此对于大型数据集来说效率较低。

在实际应用中，Python 内置的 list.sort() 方法和 sorted() 函数是首选，它们内部实现了 Timsort 算法，这是一种混合排序算法，结合了归并排序和插入排序的优点，在实践中表现非常出色，时间复杂度为 O(n log n)。

理解冒泡排序等简单算法有助于理解排序的基本思想，但对于追求性能的场景，应优先考虑使用内置函数或实现像快速排序、归并排序等 O(n log n) 复杂度的算法。

学习并实践数据结构与算法不仅仅是为了应对面试，它更是你成为一名优秀开发者的必经之路：