第9章 图像处理中的经典机器学习方法
在本章中,我们将讨论机器学习技术在图像处理中的应用。首先,学习机器学习的两种算法——监督学习和无监督学习;其次,讨论一些流行的无监督机器学习技术的应用,如聚类和图像分割等问题。
我们还将研究监督机器学习技术在图像分类和目标检测等问题上的应用。使用非常流行的scikit-learn
库,以及scikit-image
和Python-OpenCV
(cv2
)来实现用于图像处理的机器学习算法。在本章中,我们将带领读者深入了解机器学习算法及用其解决的问题。
本章主要包括以下内容:
- 监督学习与无监督学习;
- 无监督机器学习——聚类、PCA和特征脸;
- 监督机器学习——基于手写数字数据集的图像分类;
- 监督机器学习——目标检测。
9.1 监督学习与无监督学习
机器学习算法主要有以下两种类型。
(1)监督学习。在这种类型的学习中,已知输入数据集和正确的标签,需要学习输入和输出之间的关系(作为函数)。手写数字分类问题是监督(分类)问题的一个例子。
(2)无监督学习。在这种类型的学习中,很少或根本不知道输出应该是什么样的。人们可以推导得到数据的结构而不必知道变量的影响。聚类(也可以看作分割)就是一个很好的例子,在图像处理技术中,并不知道哪个像素属于哪个片段的先验知识。
那么对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,则称这个计算机程序正在从经验E中学习。
例如,假设有一组手写数字图像及其标签(从0到9的数字),需要编写一个Python程序,该程序学习了图片和标签(经验E)之间的关联,然后自动标记一组新的手写数字图像。
在本例中,任务T是为图像分配标签(即对数字图像进行分类或标识),程序中能够正确识别的新图像的比例为性能P
Get Python图像处理实战 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.