第4章 找到变量之间的关系——回归方法

本章主要内容

  • 简单的线性回归
  • 如何获得一个普通最小二乘法估计
  • 测量直线的截距和斜率的方法
  • 进行多元线性回归和多项式回归的方法
  • 如何使用回归学习器App(regression learner App)进行回归分析

回归分析是研究一组自变量(解释变量)和一个因变量(反应变量)的统计方法。通过这种方法,我们能够理解反应变量的值是如何随着解释变量的值的改变而变化的。

假设我们有一组驾驶摩托车的人的相关信息:驾龄、一年内行驶的公里数以及驾驶过程中摔倒的次数。通过回归方法,我们能够发现,平均而言,当行驶的公里数增加时,摔倒的次数也会增加。一个人的驾龄越长,也就是经验越丰富,摔倒的次数会更少。

可以借助回归分析达到以下两个目的。

(1)解释:借助一个特定的理论模型,理解和衡量自变量对因变量的影响。

(2)预测:得到一个自变量的线性组合,用来预测因变量的值。

本章展示了如何在MATLAB环境下进行精确的回归分析。统计和机器学习工具箱提供了大量的回归算法,包括线性回归、非线性回归、广义线性模型和混合效应模型。我们将探索用于回归分析(包括拟合、预测和绘图)的MATLAB接口。这个接口提供了对table变量[1]和分类数组的原生支持。这些功能加快了数据分析的速度,产生了更加简洁和可读的MATLAB代码,同时去除了用户自身操作矩阵的要求。

在本章的末尾,我们能够使用不同的回归方法,能够把回归方法应用到自己的数据中,并且理解回归算法是如何起作用的。借助MATLAB函数,我们会理解回归方法把数据拟合为方程时所涉及的基本概念,学会为回归分析准备数据。我们还将讨论简单线性回归、普通最小二乘估计、相关性和多元线性回归等主题。

在上一章中,我们学习了两个定量变量(如 ...

Get MATLAB机器学习 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.