第4章 机器学习基础
前文讲解了如何建立深度学习模型来解决分类和回归问题,比如图像分类和平均用户观看时间预测的示例。同样地,我们从直观上了解了如何处理深度学习问题。本章将介绍如何处理不同种类的问题,以及可以改善模型性能的不同的潜在方法。
本章涵盖了以下主题:
- 分类和回归之外的其他类型的问题;
- 评估问题,理解过拟合、欠拟合,以及解决这些问题的技巧;
- 为深度学习准备数据。
请记住,在本章中讨论的大多数技术都是机器学习和深度学习通用的,一部分用于解决过拟合问题的技术(如dropout)除外。
4.1 三类机器学习问题
在之前的所有例子中,尝试解决的是分类(预测猫或狗)或回归(预测用户在平台上花费的平均时间)问题。所有这些都是有监督学习的例子,目的是找到训练样例和目标之间的映射关系,并用来预测未知数据。
有监督学习只是机器学习的一部分,机器学习也有其他不同的部分。以下是3种不同类型的机器学习:
- 有监督学习;
- 无监督学习;
- 强化学习。
下面详细讲解各种算法。
4.1.1 有监督学习
在深度学习和机器学习领域中,大多数成功用例都属于有监督学习。本书中所涵盖的大多数例子也都是有监督学习的一部分。来看看有监督学习的一些常见的例子。
- 分类问题:狗和猫的分类。
- 回归问题:预测股票价格、板球比赛成绩等。
- 图像分割:进行像素级分类。对于自动汽车驾驶来说,从摄像机拍摄的照片中,识别出每个像素属于什么物体是很重要的。这些像素可以是汽车、行人、树、公共汽车等。
- 语音识别:OK Google、Alexa和Siri都是语音识别的例子。
- 语言翻译:从一种语言翻译成另一种语言。
4.1.2 无监督学习
在没有标签数据的情况时,可以通过可视化和压缩来帮助无监督学习技术理解数据。两种常用的无监督学习技术是: ...
Get PyTorch深度学习 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.