book

R概率图模型入门与实践

Name: R概率图模型入门与实践
ISBN: 9781836201991

by Posts & Telecom Press, David Bellot

May 2024

Intermediate to advanced

202 pages

3h 12m

Chinese

Packt Publishing

Read now

Unlock full access

版权信息
版权声明
内容提要
作者简介
译者简介
审稿者简介
前言
主要内容环境准备本书受众读者反馈客户支持下载示例代码勘误版权疑问
第1章概率推理
1.1 机器学习1.2 使用概率表示不确定性1.2.1 信念和不确定性的概率表示1.2.2 条件概率1.2.3 概率计算和随机变量1.2.4 联合概率分布1.2.5 贝叶斯规则1.3 概率图模型1.3.1 概率模型1.3.2 图和条件独立1.3.3 分解分布1.3.4 有向模型1.3.5 无向模型1.3.6 示例和应用1.4 小结
第2章精确推断
2.1 构建图模型2.1.1 随机变量的类型2.1.2 构建图2.2 变量消解2.3 和积与信念更新2.4 联结树算法2.5 概率图模型示例2.5.1 洒水器例子2.5.2 医疗专家系统2.5.3 多于两层的模型2.5.4 树结构2.6 小结
第3章学习参数
3.1 引言3.2 通过推断学习3.3 最大似然法3.3.1 经验分布和模型分布是如何关联的？3.3.2 最大似然法和R语言实现3.3.3 应用3.4 学习隐含变量——期望最大化算法3.4.1 隐变量3.5 期望最大化的算法原理3.5.1 期望最大化算法推导3.5.2 对图模型使用期望最大化算法3.6 小结

第4章贝叶斯建模——基础模型
4.1 朴素贝叶斯模型4.1.1 表示4.1.2 学习朴素贝叶斯模型4.1.3 完全贝叶斯的朴素贝叶斯模型4.2 Beta二项式分布4.2.1 先验分布4.2.2 带有共轭属性的后验分布4.2.3 如何选取Beta参数的值4.3 高斯混合模型4.3.1 定义4.4 小结
第5章近似推断
5.1 从分布中采样5.2 基本采样算法5.2.1 标准分布5.3 拒绝性采样5.3.1 R语言实现5.4 重要性采样5.4.1 R语言实现5.5 马尔科夫链蒙特卡洛算法5.5.1 主要思想5.5.2 Metropolis-Hastings算法5.6 概率图模型MCMC算法R语言实现5.6.1 安装Stan和RStan5.6.2 RStan的简单例子5.7 小结
第6章贝叶斯建模——线性模型
6.1 线性回归6.1.1 估计参数6.2 贝叶斯线性模型6.2.1 模型过拟合6.2.2 线性模型的图模型6.2.3 后验分布6.2.4 R语言实现6.2.5 一种稳定的实现6.2.6 更多R语言程序包6.3 小结
第7章概率混合模型
7.1 混合模型7.2 混合模型的期望最大化7.3 伯努利混合7.4 专家混合7.5 隐狄利克雷分布7.5.1 LDA模型7.5.2 变分推断7.5.3 示例7.6 小结
附录
参考文献有关贝叶斯历史的书籍有关机器学习的书籍文章
欢迎来到异步社区！
异步社区的来历社区里都有什么？购买图书下载资源与作译者互动灵活优惠的购书纸电图书组合购买社区里还可以做什么？提交勘误写作会议活动早知道加入异步

Content preview from R概率图模型入门与实践

第5章　近似推断

这一章会介绍第二类推断算法。得益于它的广泛性，它也许是最重要的算法。它的方法与之前学习到的完全不同。其实，我们已经看到了两类算法：一类是基于纯解析的，通过手动计算后验概率分布的方案；另一类是使用图模型中的信息传递的方案。两种情形的结果都是精确的。对于解析的方案，计算过程通常分解为计算后验概率的函数。对于信息传递的算法，计算后验概率可以通过图中的信息传递逐步实现。如果图形不适合这一类算法，计算过程会变得非常耗时，且难以控制。

但是在许多情况下，我们经常用精度换速度，这就是近似推断的主要思想。如果没有那么精确，是否影响很大？然而，在多数问题中，近似推理依然很精确。另一方面，它允许我们处理带有许多不同分布的更加复杂的模型。这类模型通常让其他方法变得完全不可行。

我们会在这一章使用一类重要的算法，即采样算法（Sampling Algorithms），也叫作蒙特卡洛采样（Monte-Carlo Sampling）。其主要思想是从后验分布中随机抽出数据，以便使用简单的统计代替复杂的计算。例如，如果我们想计算一个随机变量的后验概率平均值，我们可以从后验分布中随机抽取许多样本，然后计算这些样本的平均值。

蒙特卡洛采样使得贝叶斯方案在科学研究中的应用成为可能。以前，贝叶斯模型难以计算，甚至无法计算。

具体说来，我们会介绍下列算法：

拒绝采样和重要度采样。它们是许多其他模型的基础。
马尔科夫链蒙特卡洛（Markov Chain Monte-Carlo）和Metropolis-Hastings算法。

这两个算法会涵盖蒙特卡洛方法的大部分知识。而今，许多新的算法也逐渐被提出。

5.1　从分布中采样

通常概率图模型有一个比较大的问题：难以控制。概率图模型会变得非常复杂，以至于无法在合理的时间内运行任何逻辑，更不用说学习模型了。对于期望最大化这类简单的算法，我们需要计算每次迭代的后验概率。如果像当今的情况，数据集太大，模型又有许多维度，那么该算法也变得无法使用。而且，我们还只是局限在一小类分布上，例如多项式分布或者高斯分布。尽管它们可以涵盖大量的应用，但是并不是任何问题都是如此。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9781836201991

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

R概率图模型入门与实践

by Posts & Telecom Press, David Bellot

第5章　近似推断

5.1　从分布中采样

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.