book

机器学习实战：基于Scikit-Learn、Keras 和TensorFlow （原书第2 版）

by Aurélien Géron

October 2020

Intermediate to advanced

693 pages

16h 26m

Chinese

China Machine Press

Read now

Unlock full access

Content preview from 机器学习实战：基于Scikit-Learn、Keras 和TensorFlow （原书第2 版）

208

｜

第

章

在此步骤之后，权重矩阵

（包含权重

ij,

）对训练实例之间的局部线性关系进行编码。

第二步是将训练实例映射到

维空间（其中

），同时尽可能保留这些局部关系。如

果

(

)

是此

维空间中

(

)

的图像，则我们希望

(

)

与

∑

ij,

()j

之间的平方距离尽可能小。

这种想法导致了公式 8-5 中描述的无约束优化问题。它看起来与第一步非常相似，但是

我们没有保持实例固定并找到最佳权重，而是相反：保持权重固定并找到实例图像在低

维空间中的最佳位置。注意

是包含所有

(

)

的矩阵。

公式 8-5：LLE 第二步：在保持关系的同时减少维度

Z zz

= −arg min

∑∑

= =11







() ( )ij

ij,

Scikit-Learn 的 LLE 实现具有以下计算复杂度：

(

log(

)

log(

)) 用于找到

个最近的

邻居，

(

mnk

) 用于优化权重，

(

) 用于构造低维表示。不幸的是，最后一项中的

使该算法很难扩展到非常大的数据集。

8.6 其他降维技术

还有许多其他降维技术，Scikit-Learn 中提供了其中几种。以下是一些很受欢迎的降维

技术：

随机投影

顾名思义，使用随机线性投影将数据投影到较低维度的空间。这听起来可能很疯

狂，但事实证明，这样的随机投影实际上很有可能很好地保持距离，就如 William

B. Johnson 和 Joram Lindenstrauss 在著名引理中的数学证明。降维的质量取决于实

例数目和目标维度 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

算法技术手册（原书第2 版）

George T.Heineman, Gary Pollice, Stanley Selkow

Go语言编程

威廉·肯尼迪

数据库系统内幕

Alex Petrov

管理Kubernetes

Brendan Burns, Craig Tracey

Publisher Resources

ISBN: 9787111665977