
19
第
2
章
计算机视觉简介
虽然本书的目的不是教你构建和训练机器学习模型的所有基础知识,但我确实想涵盖
一些基本场景,以便本书仍然可以独立使用。如果你想了解更多关于使用 TensorFlow
的模型创建过程,我推荐我的书籍
AI and Machine Learning for Coders
(由 O
’
Reilly 出
版),如果你想深入探究,那么 Aurélien Géron 的优秀著作《机器学习实战:基于 Scikit-
Learn、Keras 和 TensorFlow 》一书是必需的!
在本章中,我们将越过你在第 1 章创建的非常基本的模型,查看两个更复杂的模型,你
将在其中处理计算机视觉
—
计算机如何“看到”对象。与术语“人工智能”和“机器
学习”类似,短语“计算机视觉”和“看”可能会导致人们误解模型的基本原理。
计算机视觉是一个巨大的研究领域,本章我们将重点关注几个核心场景,我们将使用技
术来解析图像的内容,或者标记图像的主要内容,或者在图像中查找物体。
它并不是真正的“视觉”或“看”,而是更多的结构化算法,允许计算机解析图像的像
素。它不会“理解”图像,就像它将单词解析为单个字符串时理解句子的含义一样!
如果我们尝试使用传统的基于规则的方法来完成这项任务,即使是最简单的图像,我们
最终也会有很多代码行。机器学习是这里的关键参与者,正如你在本章中看到的,通过
使用我们在第 1 章用到的相同代码模式,更深入一点,我们可以创建解析图像内容的模
型……只需几行代码。让我们开始吧。
2.1
为视觉使用神经元
在第 ...