第4章 广义线性模型
“我们泛泛地思考,却在细节中生活。”
——阿尔弗雷德·诺思·怀特黑德(Alfred North Whitehead)
第3章中,我们使用了输入变量的线性组合来预测输出变量的均值。我们假设后者服从高斯分布。使用高斯分布在很多情况下都有效,不过对于一些其他情况,选择不同的分布可能更合适。前面我们已经见过一个例子,采用t分布替换了高斯分布。在本章中,我们将看到更多的例子,其中用高斯分布之外的其他分布是明智的。正如我们将要学习的,会有一个通用的主题或模式,可以用来将线性模型推广到更多场景。本章,我们将探讨以下主题。
● 广义线性模型。
● 逻辑回归和逆连接函数。
● 简单逻辑回归。
● 多元逻辑回归。
● softmax函数以及多项逻辑回归。
● 泊松回归。
● 零膨胀泊松回归。
4.1 简介
本章的核心思想之一非常简单:为了预测一个输出变量的均值,我们可以将任意函数应用于输入变量的线性组合:
(4.1)
其中f是一个函数,我们称之为逆连接函数。可选的逆连接函数有很多,最简单的应该就是恒等函数,它的输出与输入相等。第1章中所有的模型都使用了恒等函数,为了简单起见,我们省略了它。恒等函数本身可能不是很有用,不过它可以让我们用一种更统一的方式思考不同的模型。
提示:为什么我们称 ...
Get Python贝叶斯分析(第2版) now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.