type
Page
status
Invisible
date
Feb 14, 2026
slug
Machine_Learning/deep-learning-study-notes/3_5
summary
动手深度学习v2课程
tags
机器学习
深度学习
category
icon
password
MNIST数据集是图像分类中广泛使用的数据集之一,但作为基础数据集过于简单。这里采用类似但更复杂的Fashion-MNIST数据集。

3.5.1. 读取数据集

通过框架中的内置函数将数据集下载并读取到内存中
Fashion-MNIST由10个类别的图像组成,每个类别由训练数据集(train dataset)中的6000张图像 和测试数据集(test dataset)中的1000张图像组成。因此,训练集和测试集分别包含60000和10000张图像。测试数据集不会用于训练,只用于评估模型性能。
每个输入图像的高度和宽度均为28像素。数据集由灰度图像组成,通道数为1。
Fashion-MNIST中包含的10个类别,分别为t-shirt(T恤)、trouser(裤子)、pullover(套衫)、dress(连衣裙)、coat(外套)、sandal(凉鞋)、shirt(衬衫)、sneaker(运动鞋)、bag(包)和ankle boot(短靴)。 以下函数用于在数字标签索引及其文本名称之间进行转换。
创建一个函数来可视化样本
以下是训练数据集中前几个样本的图像及其相应的标签。
notion image

3.5.2. 读取小批量

为了简化训练集和测试集的读取,我们使用内置的数据迭代器(DataLoader),无需从头实现。训练时,数据会按 batch_size 分成若干小批量逐批读取;同时迭代器支持在每轮训练前随机打乱样本,使小批量采样更随机、更不易产生偏差。
测试一下读取训练数据所需的时间

3.5.3. 整合所有组件

现在定义load_data_fashion_mnist函数,用于获取和读取Fashion-MNIST数据集。这个函数返回训练集和验证集的数据迭代器。此外,这个函数还接受一个可选参数resize,用于将图像大小调整为另一种形状。
下面测试指定resize来调整图像大小的功能

3.5.4. 小结

  • Fashion-MNIST是一个服装分类数据集,由10个类别的图像组成。我们将在后续章节中使用此数据集来评估各种分类算法。
  • 我们将高度像素,宽度像素图像的形状记为
  • 数据迭代器是获得更高性能的关键组件。依靠实现良好的数据迭代器,利用高性能计算来避免减慢训练过程。
 
Loading...