计算机视觉：CIFAR

时间：2025-06-24 12:16:54　来源：新华社

【字体：大　中　小】

CIFAR-10 和 CIFAR-100 两个非常重要的图像分类数据集，广泛应用于计算机视觉领域的深度学习和研究和实验。以下是对这两个数据集的更详细介绍，包括其特性、应用场景、数据预处理和模型训练的细节。

一、CIFAR-10。

1. 详细描述。

数据量：60,000 张彩图像󿀌每个图像的大小为 32x32 像素。
分布：
50,000 训练图像。
10,000 图像张测试。
类别：分为 10 类别，每类 6,000 张图像。
列别1：飞机 (airplane)。
类别2：汽车 (automobile)。
类别3：鸟 (bird)。
类别4：猫 (cat)。
类别5：鹿 (deer)。
类别6：狗 (dog)。
类别7：青蛙 (frog)。
列别8༚马 (horse)。
类别9：船 (ship)。
列出10：卡车 (truck)。

2. 特性。

图像明亮小巧，适合初学者和快速实验。
各类图像多样性，具有一定的重叠特性，分类的挑战性增加了。

二、CIFAR-100。

1. 详细描述。

数据量：与 CIFAR-10 相同，包含 60,000 图像，每个图像的大小为 32x32 像素。
分布：
        50,000 训练图像。
        10,000 图像张测试。
类别：CIFAR-100 按 100 分类，每类 600 图像，而且这些类别分为 20 超类，每一个超类对应 5 个子类。以下是一些超类的例子：
        水果和蔬菜：
                苹果(apple)。
                橙子 (orange)。
        动物：
                蛇 (snake)。
                山羊 (goat)。
        交通工具：
                飞机(airplane)。
                汽车 (automobile)。

2. 特性。

相较于 CIFAR-10，CIFAR-100 提供了更大的类别数量和复杂性，基准测试适用于高级实验和深度学习模型。
数据集涵盖了更广泛的视觉对象，学习挑战增加了任务的难度。

三、使用场景。

        机器学习实验：这两个数据集广泛应用于卷积神经网络（CNN）等深度学习体系结构的验证，特别是图像分类任务。
        #xff1基准测试a;研究人员和开发人员可以使用这两个数据集来比较不同模型的性能，作为标准测试集。
        #xff1教学与培训a;因其简单性，这两个数据集通常用于教学或为初学者提供实际的图像识别任务。

四、下载数据集。

您可以通过以下链接获得 CIFAR-10 和 CIFAR-100 数据集：

CIFAR-10: [下载链接](https://www.cs.toronto.edu/~kriz/cifar.html)。
CIFAR-100: [下载链接](https://www.cs.toronto.edu/~kriz/cifar.html)。

五、代码示例。

1. 加载和预处理数据。

如何使用以下代码演示 TensorFlow/Keras 加载 CIFAR-10 数据集，简单的预处理：

import tensorflow as tf  from tensorflow.keras import datasets  # 加载 CIFAR-10 数据集  (x_train, y_train), (x_test, y_test) = datasets.cifar10.load_data()  # #xff1数据预处理a;缩放像素值 [0,1] 范围  x_train = x_train.astype('float32#39;) / 255.0  x_test = x_test.astype('float32#39;) / 255.0  # 检查数据的形状  print(f'训练数据形状： { x_train.shape}, 标签形状: { y_train.shape}')  print(f'测试数据形状： { x_test.shape}, 标签形状: { y_test.shape}')  # 可视化部分图像  import matplotlib.pyplot as plt  def visualize_data(images, labels, num=10):      plt.figure(figsize=(15, 3))      for i in range(num):          plt.subplot(2, 5, i + 1)          plt.imshow(images[i])          plt.title(f'Label: { labels[i][0]}')          plt.axis('off')      plt.show()  visualize_data(x_train, y_train, 10)。

2. 模型训练示例。

以下是卷积神经网络（CNN）进行 CIFAR-10 数据集训练示例代码：

from tensorflow.keras import layers, models  # 构建 CNN 模型  model = models.Sequential([      layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),      layers.Maxpoling2D(pool_size=(2, 2)),      layers.Conv2D(64, (3, 3), activation='relu'),      layers.Maxpoling2D(pool_size=(2, 2)),      layers.Conv2D(64, (3, 3), activation='relu'),      layers.Flatten(),      layers.Dense(64, activation='relu'),      layers.Dense(10, activation='softmax')  # 对于 CIFAR-10，输出类别数为 10  ])  # 编译模型  model.compile(optimizer='adam',                loss='sparse_categorical_crossentropy',                metrics=['accuracy'])  # 训练模型  model.fit(x_train, y_train, epochs=10, validation_data=(x_test, y_test))# 保存模型  model.save('image_classification_model.h5')。

六、总结。

CIFAR-10 和 CIFAR-100 是机器学习和深度学习标准数据集的基石，对于从事图像分类研究的研究人员和开发人员，它们提供了丰富的实验基础。

[责任编辑：百度一下]

一、CIFAR-10。

1. 详细描述。

2. 特性。

二、CIFAR-100。

1. 详细描述。

2. 特性。

三、使用场景。

四、下载数据集。

五、代码示例。

1. 加载和预处理数据。

2. 模型训练示例。

六、总结。

相关新闻