由于 研究、训练和评估模型是一个耗时的过程,因此在 ML 中,走错方向可能会付出非常高的代价。这就是为什么本书侧重于降低风险和确定工作的重中之重。
第一部分侧重于规划,以便最大限度地提高我们的速度和成功机会,而本章将深入探讨实施。如图 II-1所示,在 ML 中,就像在许多软件工程中一样,你应该尽快实现 最小可行产品 (MVP)。本节将介绍这一点:建立管道并对其进行评估的最快方法。
改进上述模式将是本书第三部分的重点。
我们将分两步建立初始模型:
在本章中,我们将构建应用程序的结构和脚手架。这将包括构建一个接收用户输入并返回建议的管道,以及一个在使用模型前对其进行训练的独立管道。
在本章中,我们将重点收集和检查初始数据集。我们的目标是快速识别数据中的模式,并预测其中哪些模式对我们的模型具有预测性和实用性。