图像分类数据集FashionMNIST

2023-02-12

图像分类数据集(Fashion-MNIST)

简介

Fashion-MNIST是一个经典的图像分类数据集,由Zalando Research创建。该数据集包含了10个类别的灰度图像,每个类别有6000个训练样本和1000个测试样本,共计70000张图像。这些图像展示了各种服装物品,包括T恤、裤子、套头衫、连衣裙、运动鞋、高跟鞋、外套、踝靴、背包和手提包。

Fashion-MNIST数据集是作为MNIST数据集的替代品而创建的,因为在MNIST数据集被广泛使用后,人们逐渐发现需要更具挑战性的图像数据集来评估新的算法和模型。Fashion-MNIST数据集的成为了一个流行的基准数据集,用于测试图像分类算法的效果。

数据集特点

  • 数据量丰富:超过70000张图像可以提供更多的训练和测试数据,以及更好的泛化能力。
  • 图像尺寸适中:每个图像的大小为28x28像素,使得训练和测试速度更快,同时也降低了模型过拟合的风险。
  • 多类别分类:数据集包含多种类别的衣物图像,可用于训练多分类模型。

使用场景

Fashion-MNIST数据集适用于以下场景:

  • 图像分类算法测试:作为基准数据集,用于评估和比较不同图像分类算法的性能。
  • 模型训练:用于训练和验证图像分类模型,特别是针对服装物品的分类任务。
  • 学术研究:用于学术研究中的图像分类实验,帮助研究人员开发和改进新的算法。

数据集结构

数据集分为训练集和测试集,具体结构如下:

  • 训练集:包含60000张图像,每个类别6000张。
  • 测试集:包含10000张图像,每个类别1000张。

每个图像的标签对应以下10个类别:

  1. T恤
  2. 裤子
  3. 套头衫
  4. 连衣裙
  5. 运动鞋
  6. 高跟鞋
  7. 外套
  8. 踝靴
  9. 背包
  10. 手提包

如何使用

你可以通过下载本仓库中的资源文件来获取Fashion-MNIST数据集。数据集以常见的图像格式(如PNG或JPEG)和标签文件(如CSV或TXT)的形式提供,方便直接导入到你的机器学习框架中进行训练和测试。

贡献

如果你有任何改进建议或发现了数据集中的问题,欢迎提交Issue或Pull Request。我们非常欢迎社区的贡献,以帮助改进和扩展这个数据集。

许可证

本数据集遵循开源许可证,具体许可证信息请参阅LICENSE文件。


希望这个数据集能够帮助你在图像分类任务中取得更好的成果!

下载链接

图像分类数据集Fashion-MNIST