第10章 图像处理中的深度学习——图像分类
在本章中,我们将介绍深度学习在图像处理中的最新进展。首先,区分经典学习和深度学习技术;然后阐述卷积神经网络(Convolutional Neural Network,CNN)的概念,这是一种对图像处理特别有用的深度神经网络架构;接下来介绍几个图像数据集的图像分类问题,以及如何使用两个非常流行的深度学习库TensorFlow和Keras来解决这两个问题;最后介绍如何训练深度卷积神经网络架构并将其用于预测。
本章主要包括以下内容:
- 图像处理中的深度学习;
- 卷积神经网络;
- 使用TensorFlow或Keras进行图像分类;
- 应用于图像分类的主流的深度卷积神经网络。
10.1 图像处理中的深度学习
机器学习(Machine Learning,ML)的主要目标是泛化,也就是说,在训练数据集上训练算法,并且使得这个算法在不可见的数据集上具有高性能(准确性)。要完成复杂的图像处理任务(如图像分类),拥有的训练数据越多,就能更好处理好过拟合(例如正则化),人们就可以期待所学习的机器学习模型具有更好的泛化能力。但是在传统的机器学习技术中,大量的训练数据使得计算成本非常昂贵,而且学习(泛化的改进)常常在某个点停止。此外,传统的机器学习算法通常需要大量的专业领域知识和人工干预,而且它们只能满足它们的设计要求,仅此而已。这是深度学习模型非常有前景的地方。
10.1.1 什么是深度学习
深度学习有如下一些众所周知且被广泛接受的定义。
(1)深度学习是机器学习的子集。
(2)深度学习使用级联的多层(非线性)处理单元,称为人工神经网络(Artifical Neural Network,ANN),以及受大脑结构和功能(神经元)启发的算法。每个连续层使用前一层的输出作为输入。 ...
Get Python图像处理实战 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.