book

Python贝叶斯分析（第2版）

by Posts & Telecom Press, Osvaldo Martin

February 2024

Intermediate to advanced

301 pages

4h 44m

Chinese

Packt Publishing

Read now

Unlock full access

1.1 统计学、模型以及本书采用的方法1.1.1 与数据打交道1.1.2 贝叶斯建模1.2 概率论1.2.1 解释概率1.2.2 定义概率1.3 单参数推断抛硬币问题1.4 报告贝叶斯分析结果1.4.1 模型表示和可视化1.4.2 总结后验1.5 后验预测检查1.6 总结1.7 练习

2.1 简介2.2 PyMC3指南用PyMC3解决抛硬币问题2.3 总结后验基于后验的决策2.4 随处可见的高斯分布2.4.1 高斯推断2.4.2 鲁棒推断2.5 组间比较2.5.1 Cohen’s d2.5.2 概率优势2.5.3 “小费”数据集2.6 分层模型2.6.1 收缩2.6.2 额外的例子2.7 总结2.8 练习
3.1 一元线性回归3.1.1 与机器学习的联系3.1.2 线性回归模型的核心3.1.3 线性模型与高自相关性3.1.4 对后验进行解释和可视化3.1.5 皮尔逊相关系数3.2 鲁棒线性回归3.3 分层线性回归相关性与因果性3.4 多项式回归3.4.1 解释多项式回归的系数3.4.2 多项式回归——终极模型3.5 多元线性回归3.5.1 混淆变量和多余变量3.5.2 多重共线性或相关性太高3.5.3 隐藏效果变量3.5.4 增加相互作用3.5.5 变量的方差3.6 总结3.7 练习
4.1 简介4.2 逻辑回归4.2.1 逻辑回归模型4.2.2 鸢尾花数据集4.3 多元逻辑回归4.3.1 决策边界4.3.2 模型实现4.3.3 解释逻辑回归的系数4.3.4 处理相关变量4.3.5 处理不平衡分类4.3.6 softmax回归4.3.7 判别式模型和生成式模式4.4 泊松回归4.4.1 泊松分布4.4.2 零膨胀泊松模型4.4.3 泊松回归和ZIP回归4.5 鲁棒逻辑回归4.6 GLM模型4.7 总结4.8 练习
5.1 后验预测检查5.2 奥卡姆剃刀原理——简单性和准确性5.2.1 参数过多会导致过拟合5.2.2 参数太少会导致欠拟合5.2.3 简单性与准确性之间的平衡5.2.4 预测精度度量5.3 信息准则5.3.1 对数似然和偏差5.3.2 赤池信息量准则5.3.3 广泛适用的信息准则5.3.4 帕累托平滑重要性采样留一法交叉验证5.3.5 其他信息准则5.3.6 使用PyMC3比较模型5.3.7 模型平均5.4 贝叶斯因子5.4.1 一些讨论5.4.2 贝叶斯因子与信息准则5.5 正则化先验5.6 深入WAIC5.6.1 熵5.6.2 KL散度5.7 总结5.8 练习
6.1 简介6.2 有限混合模型6.2.1 分类分布6.2.2 狄利克雷分布6.2.3 混合模型的不可辨识性6.2.4 怎样选择K6.2.5 混合模型与聚类6.3 非有限混合模型狄利克雷过程6.4 连续混合模型6.4.1 贝塔-二项分布和负二项分布6.4.2 t分布6.5 总结6.6 练习
7.1 线性模型和非线性数据7.2 建模函数7.2.1 多元高斯函数7.2.2 协方差函数与核函数7.3 高斯过程回归7.4 空间自相关回归7.5 高斯过程分类7.6 Cox过程7.6.1 煤矿灾害7.6.2 红杉数据集7.7 总结7.8 练习
8.1 简介8.2 非马尔可夫方法8.2.1 网格计算8.2.2 二次近似法8.2.3 变分法8.3 马尔可夫方法8.3.1 蒙特卡洛8.3.2 马尔可夫链8.3.3 梅特罗波利斯-黑斯廷斯算法8.3.4 哈密顿蒙特卡洛8.3.5 序贯蒙特卡洛8.4 样本诊断8.4.1 收敛8.4.2 蒙特卡洛误差8.4.3 自相关8.4.4 有效样本量8.4.5 分歧8.5 总结8.6 练习

Content preview from Python贝叶斯分析（第2版）

序　　言

概率编程是一类计算机编程框架，用于灵活地构建贝叶斯模型，一旦构建好模型，强大的推断算法便可以独立于特定的模型而工作，并通过模型拟合数据。把灵活的模型定义与自动推断结合在一起便得到了一个强大的工具，方便研究者们快速地构建、分析和迭代新的统计模型。这个迭代过程与以往用贝叶斯模型拟合数据的方式有很大的不同：以往的推断算法仅对某一特定的模型有效。这不仅导致人们在构建模型和设计推断算法的时候，需要具备很强的数据技巧，还降低了迭代速度：需要先修改模型，然后重新设计推断算法。而概率编程则将统计建模的过程大众化，大大降低了对使用者的数学水平的要求，缩短了构建新模型时所需花费的时间，同时还能增强使用者对数据内涵的洞察。

概率编程背后的思想并不新鲜。BUGS是最早的概率编程实践之一，于1989年首次发布。由于能够成功应用的模型非常有限，而且推断过程很慢，因此这些第一代语言不太实用。如今，人们已经开发出了许多概率编程语言，并在学术界和各大公司（如谷歌、微软、亚马逊）广泛地用于解决各种复杂问题。那现代的概率编程语言有哪些变化呢？最大的变化来自哈密顿蒙特卡洛采样算法，它相较以往的采样算法要高出若干个数量级，以往的算法只能用来解决一些玩具问题，而如今的算法可以用于解决非常复杂的大规模问题。尽管这些采样器起源于1987年，但得益于最近的一些概率编程系统，如Stan和PyMC3，它们才被广泛地使用起来。

本书将从务实的角度介绍概率编程这一强大而灵活的工具，它将影响你如何思考和解决复杂的分析问题。作为PyMC3的核心开发者之一，没有人比Osvaldo Martin更适合来写这本书了。Osvaldo非常擅长将复杂的问题拆解成容易理解和吸收的部分，他宝贵的实战经验将带领读者穿过这片复杂的领域。书中的图表和代码是非常有用的资源，这些都将增进读者对背后理论知识的直观理解。 ...