第4章　线性回归和逻辑回归

通过常规的特征对相似信息进行分组后，让我们从数学角度出发，寻找一种描述数据的方法。假设数据样本保持它们之前的特性，该方法通过一个特定的函数，压缩大量的信息，并且预测结果。

本章将讨论以下几点。

4.1　回归分析

本章将先解释一个基本的问题：什么是回归？

回归基本上是一个统计过程。正如在第1章看到的，回归包含一系列具有特定概率分布的数据。总之，有大量的数据需要去描述。

在回归中，需要寻找哪些元素呢？最终目的是确定自变量和因变量的关系，因变量可以最优地适应所提供的数据。当一个函数可以用来描述自变量和因变量之间的关系时，这个函数将被称为回归函数。

有大量的函数类型可以用来对现有的数据进行建模，常见的是线性函数、多项式函数和指数函数。

这些方法的目标是确定一个目标函数，在这个例子中，函数将输出有限数量的未知优化参数，称为参数回归方法。

回归通常用于预测数据对应的变量值，是数据分析项目中最常用的初始数据建模方法，也可以用于优化过程，在相关但分散的数据之间找到共同点。

下面列出了一些回归分析的应用场景。

在处理数据的日常工作中，并不是所有的元素都是相同的，因此它们需要根据各自的特点进行特殊处理。为了识别问题的变量的合适度，可以进行一个非常重要的区分，即使用以下标准将数据类型划分为定量数据变量和定性数据变量。 ...

Get 机器学习开发者指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.