Python 基础入门 Day08

111次阅读
2 条评论

共计 2293 个字符,预计需要花费 6 分钟才能阅读完成。

欢迎来到 Python 基础入门 Day08!在前几天的学习中,我们已经掌握了 Python 的基本语法、数据结构、函数与模块、文件操作、异常处理、面向对象编程,以及常用内置模块和正则表达式。如果你还没有学习之前的内容,可以通过以下链接进行复习:

今天,我们将学习 Python 的数据可视化工具 。数据可视化是展示数据分析结果的有力工具,可以帮助我们直观地理解数据。我们将重点介绍 matplotlibpandas 两个常用的 Python 库。

目录

  1. 数据可视化简介
  2. matplotlib 基础
  3. pandas 数据处理与可视化
  4. 综合实例:绘制多种图表
  5. 小结与练习

一、数据可视化简介

数据可视化是将数据转化为图表的过程,通过视觉化手段揭示数据中的规律和趋势。Python 提供了多个强大的可视化库,其中最常用的是 matplotlibpandas 的内置绘图功能。


二、matplotlib 基础

matplotlib 是 Python 最基础的绘图库,可以创建各种静态、交互式和动画图表。

2.1 安装 matplotlib

在使用前,确保已安装 matplotlib

pip install matplotlib

2.2 绘制简单的折线图

import matplotlib.pyplot as plt

# 数据
x = [1, 2, 3, 4, 5]
y = [10, 15, 13, 18, 16]

# 绘制折线图
plt.plot(x, y, marker='o')
plt.title('简单折线图')
plt.xlabel('X 轴')
plt.ylabel('Y 轴')
plt.grid(True)
plt.show()

2.3 绘制柱状图

# 数据
categories = ['A', 'B', 'C', 'D']
values = [4, 7, 1, 8]

# 绘制柱状图
plt.bar(categories, values, color='skyblue')
plt.title('简单柱状图')
plt.xlabel('类别')
plt.ylabel('值')
plt.show()

三、pandas 数据处理与可视化

pandas 是 Python 最常用的数据分析库,自带强大的数据处理和可视化功能。

3.1 安装 pandas

pip install pandas

3.2 使用 pandas 读取 CSV 文件

import pandas as pd

# 读取 CSV 文件
df = pd.read_csv('data.csv')
print(df.head())

3.3 使用 pandas 绘制折线图

# 生成示例数据
data = {'Year': [2018, 2019, 2020, 2021, 2022],
        'Sales': [100, 150, 200, 250, 300]}
df = pd.DataFrame(data)

# 绘制折线图
df.plot(x='Year', y='Sales', kind='line', marker='o', title='年度销售额')
plt.show()

3.4 使用 pandas 绘制饼图

# 绘制饼图
df.plot(kind='pie', y='Sales', labels=df['Year'], autopct='%1.1f%%', title='销售占比')
plt.ylabel('')  # 移除 y 轴标签
plt.show()

四、综合实例:绘制多种图表

我们来综合运用 matplotlibpandas 绘制多种图表,展示数据的多样性。

4.1 绘制多条折线图

import matplotlib.pyplot as plt
import pandas as pd

# 创建数据
data = {'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May'],
    'Product A': [30, 35, 40, 50, 45],
    'Product B': [20, 25, 30, 35, 30]
}
df = pd.DataFrame(data)

# 绘制多条折线图
plt.plot(df['Month'], df['Product A'], marker='o', label='Product A')
plt.plot(df['Month'], df['Product B'], marker='s', label='Product B')
plt.title('产品月销售趋势')
plt.xlabel('月份')
plt.ylabel('销售额')
plt.legend()
plt.grid(True)
plt.show()

4.2 绘制散点图

# 生成随机数据
import numpy as np

x = np.random.rand(50)
y = np.random.rand(50)

# 绘制散点图
plt.scatter(x, y, color='purple')
plt.title('随机散点图')
plt.xlabel('X 轴')
plt.ylabel('Y 轴')
plt.show()

五、小结与练习

今天我们学习了 Python 的数据可视化工具 ,重点介绍了 matplotlibpandas 的使用。数据可视化能帮助我们更直观地分析和展示数据。

今日练习题:

  1. 使用 matplotlib 绘制一条表示气温变化的折线图,X 轴为日期,Y 轴为气温。
  2. 使用 pandas 读取一个 CSV 文件,并绘制相应的柱状图。
  3. 使用 matplotlib 绘制一个包含多个类别的堆叠柱状图。
  4. 使用 pandas 绘制一个散点图,展示两组数据之间的关系。

下一节预告 :在 Day09 中,我们将学习 Python 的高级特性 ,包括生成器、装饰器和上下文管理器,敬请期待!


正文完
 0
评论(2 条评论)