
使用卷积神经网络的深度计算机视觉
|
431
14.11 练习题
1. 与用于图像分类的全连接的 DNN 相比,CNN 有什么优势?
2. 考虑由三个卷积层组成的 CNN,每个卷积层具有 3
×
3 内核,步幅为 2 和 "same"
填充。最低层输出 100 个特征图,中间层输出 200 个特征图,最顶层输出 400 个特
征图。输入图像是 200
×
300 像素的 RGB 图像。
CNN 中的参数总数是多少?如果我们使用的是 32 位浮点数,那么在对单个实例
进行预测时,至少该网络需要多少 RAM ?训练一个包含 50 个图像的小批量时会
怎样?
3. 如果训练 CNN 时 GPU 内存不足,可以尝试哪 5 种方法来解决这个问题?
4. 为什么要添加最大池化层而不是具有相同步幅的卷积层?
5. 你何时要添加局部响应归一化层?
6. 与LeNet-5 相比,你能说出AlexNet 的主要创新之处吗? GoogLeNet、ResNet、
SENet 和 Xception 的主要创新是什么呢?
7. 什么是全卷积网络?如何将密集层转换为卷积层?
8. 语义分割的主要技术困难是什么?
9. 从头开始构建自己的 CNN,并尝试在 MNIST 上实现最高的准确性。
10. 将迁移学习用于大图像分类,请执行以下步骤:
a. 创建一个训练集,每个类至少包含 100 个图像。例如,你可以根据位置(海
滩、山脉、城市等)对自己的图片进行分类,或者可以使用现有的数据集(例
如来自 TensorFlow 数据集)。
b. 将其分为训练集、验证集和测试集。 ...