第4章 广义线性模型

“我们泛泛地思考,却在细节中生活。”

——阿尔弗雷德·诺思·怀特黑德(Alfred North Whitehead)

第3章中,我们使用了输入变量的线性组合来预测输出变量的均值。我们假设后者服从高斯分布。使用高斯分布在很多情况下都有效,不过对于一些其他情况,选择不同的分布可能更合适。前面我们已经见过一个例子,采用t分布替换了高斯分布。在本章中,我们将看到更多的例子,其中用高斯分布之外的其他分布是明智的。正如我们将要学习的,会有一个通用的主题或模式,可以用来将线性模型推广到更多场景。本章,我们将探讨以下主题。

广义线性模型。

逻辑回归和逆连接函数。

简单逻辑回归。

多元逻辑回归。

softmax函数以及多项逻辑回归。

泊松回归。

零膨胀泊松回归。

4.1 简介

本章的核心思想之一非常简单:为了预测一个输出变量的均值,我们可以将任意函数应用于输入变量的线性组合:

  (4.1)

其中f是一个函数,我们称之为逆连接函数。可选的逆连接函数有很多,最简单的应该就是恒等函数,它的输出与输入相等。第1章中所有的模型都使用了恒等函数,为了简单起见,我们省略了它。恒等函数本身可能不是很有用,不过它可以让我们用一种更统一的方式思考不同的模型。

提示:为什么我们称 ...

Get Python贝叶斯分析(第2版) now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.