在上一主题中, 我们学习了如何使用无限数据集来识别数字图像。由于它的简单性, 无穷数据集是深度学习的入门数据集。无休止的数据集是深度学习的世界。
CIFAR 10(加拿大高级研究所)将更难以分类, 并且将带来我们需要克服的新障碍。它是图像的集合, 通常用于训练机器学习和计算机视觉算法。 CIFAR 10数据集包含50000个训练图像和10000个验证图像, 因此可以将这些图像分类为10个不同的类别。
CIFAR-10数据集由10个类别的60000张三十乘三十个彩色图像组成, 意味着每个类别6000张图像。该数据集分为一个测试批次和五个训练批次。每批包含10000张图像。在测试批次中, 从每个类别中随机选择1000张图像。训练批次以随机顺序包含剩余图像。一些培训批次可能包含来自一个班级的图像比另一个班级的图像更多。
这些类将完全互斥。汽车和卡车之间不会重叠。汽车包括类似于轿车和越野车的东西。卡车类仅包括大型卡车, 也不包括皮卡车。与MNIST数据集相反, 这些类中的对象本质上要复杂得多, 并且变化很大。如果我们通过CIFAR数据集进行观察, 就会发现不仅只有一种鸟或猫。鸟和猫类包含许多不同类型的鸟和猫, 它们的大小, 颜色, 放大率, 不同的角度和不同的姿势都不同。
对于无尽的数据集, 尽管我们可以用多种方法来写第一和第二。它只是变化不大, 最重要的是, 无尽的数据集是灰度标量。 CIFAR数据集包含较大的32 x 32彩色图像, 并且每个图像具有三个不同的颜色通道。现在我们最大的问题是, 在无限数据集上表现如此出色的LeNet模型是否足以对CIFAR数据集进行分类?
CIFAR-100数据集
就像CIFAR-10数据集一样。唯一的区别是它有100个类, 每个类包含600个图像。每个课程有100张测试图像和500张训练图像。这100个类别分为20个超类, 每个图像带有一个”粗糙”标签(它所属的超类)和一个”精细”标签(它所属的类)。
CIFAR-100数据集中有以下类别:
S.没有 | Superclass | Classes |
---|---|---|
1. | aquatic mammals | 海狸, 海豚, 水獭, 海豹, 鲸鱼 |
2. | flowers | 兰花, 罂粟, 玫瑰, 向日葵, 郁金香 |
3. | fish | 水族馆鱼, 比目鱼, 雷, 鲨鱼, 鳟鱼 |
4. | 食品容器 | 瓶子, 碗, 罐, 杯子, 盘子 |
5. | 家用电器 | 时钟, 电脑键盘, 灯, 电话, 电视 |
6. | 水果和蔬菜 | 苹果, 蘑菇, 橘子, 梨, 甜椒 |
7. | 家用家具 | 床, 椅子, 沙发, 桌子, 衣柜 |
8. | large carnivores | 熊, 豹, 狮子, 老虎, 狼 |
9. | 昆虫蜜蜂, 甲虫, 蝴蝶, 毛毛虫, 蟑螂 | |
10. | 大型人造户外用品 | 桥梁, 城堡, 房屋, 道路, 摩天大楼 |
11. | 大型自然户外场景 | 云, 森林, 山, 平原, 海洋 |
12. | medium-sized mammals | 狐狸, 豪猪, 负鼠, 浣熊, 臭鼬 |
13. | 大型杂食动物和食草动物 | 骆驼, 牛, 黑猩猩, 大象, 袋鼠 |
14. | 非昆虫无脊椎动物 | 螃蟹, 龙虾, 蜗牛, 蜘蛛, 蠕虫 |
15. | reptiles | 鳄鱼, 恐龙, 蜥蜴, 蛇, 乌龟 |
16. | people | 婴儿, 男孩, 女孩, 男人, 女人 |
17. | trees | 枫木, 橡木, 棕榈, 松木, 柳树 |
18. | 小哺乳动物 | 仓鼠, 鼠标, 兔子, rabbit, 松鼠 |
19. | 车辆1 | 自行车, 公共汽车, 摩托车, 皮卡车, 火车 |
20. | 车辆2 | 割草机, 火箭, 电车, 坦克, 拖拉机 |
评论前必须登录!
注册