第7章 卷积神经网络
在数据科学中,卷积神经网络(Convolutional NeuralNetwork,CNN)是一类特定的深度学习架构,它利用卷积运算来挖掘输入图像中的相关的可解释特征。CNN层之间像前馈神经网络一样互相连接,同时它利用卷积操作来模拟人类识别物体时大脑的工作原理。单个皮层神经元只对空间中某个受限区域的刺激做出反应,这称为感受野。特别地,生物医学成像曾一度是一个很有挑战性的问题,但在本章中,读者将看到如何利用CNN来发掘图像中的模式。
本章将包含以下主题。
- 卷积运算。
- 动机。
- CNN的不同层。
- CNN基础示例——MNIST手写数字分类。
7.1 卷积运算
CNN在计算机视觉领域里广泛应用,并且它们表现得比前人所使用的大多数传统计算机视觉技术要出色。CNN将著名的卷积运算和神经网络结合在一起,因此叫作卷积神经网络。因此,在深入讨论CNN的神经网络部分之前,本书将先介绍卷积运算并看看它是怎么工作的。
卷积运算的主要目的是从图像中提取信息或特征。任何图像都可以看作一个数值矩阵,而矩阵中一组特定的数值可以构成一个特征。卷积运算的目的是扫描这个矩阵,并尝试为图像挖掘相关的或可解释特征。例如,考虑一个5×5的图像,它的对应灰度(或者说像素值),用0和1来表示,如图7.1所示。
图7.1 5×5的像素值矩阵
再考虑图7.2所示的3×3的矩阵。
图7.2 3×3的像素值矩阵
如图7.3(a)~(i)所示,可以用3×3的矩阵对5×5的图像进行卷积。
Get 深度学习:核心原理与案例分析 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.