第2章 计算机视觉
学习目标
阅读完本章之后,你将能够:
- 解释人工智能和计算机视觉的影响;
- 部署计算机视觉基本算法;
- 开发机器学习基本算法;
- 构建你的第一个神经网络。
本章首先介绍计算机视觉,然后介绍几种重要的计算机视觉和机器学习基本算法。
2.1 简介
人工智能(AI)正在改变一切。AI试图通过模仿人类智能来完成各种任务。
AI中进行图像处理的分支称作计算机视觉。计算机视觉是一个跨学科科学领域,试图模仿人类的眼睛。计算机视觉不仅能从像素层面理解图像,而且能通过执行自动化任务和利用算法,获得对图像的更高层次理解。
计算机视觉算法的功能涵盖物体识别、人脸识别、图像分类、图像编辑,以及图像生成。
本章首先介绍计算机视觉,涵盖一些最基本的算法和相应练习;随后介绍机器学习,涵盖从最基本的算法到神经网络的各种算法,以及用来巩固知识的相应练习。
2.2 计算机视觉基本算法
本节首先介绍图像的表示方法;然后介绍一个对执行计算机视觉任务很有帮助的库;接着介绍一些计算机视觉任务和算法的原理,以及编写相应代码的方法。
2.2.1 图像相关术语
若想理解计算机视觉,需要先了解图像的表示方法,以及计算机对图像的解读方式。
对计算机来说,一个图像就是一组数字。具体来说,图像可以表示为一个二维数组,即由0到255之间的数字构成的一个矩阵(对灰度图像来说,0代表黑色,255代表白色),每个数字代表图像中的一个像素值(pixel value),如图2.1所示。
图2.1 未标注像素值和标注了像素值的图像表示 ...
Get Python计算机视觉和自然语言处理 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.