book

数据科学中的实用线性代数

Name: 数据科学中的实用线性代数
Author: Mike X Cohen
ISBN: 9798341657236

by Mike X Cohen

May 2025

Beginner to intermediate

328 pages

3h 39m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
1.导言
什么是线性代数，为什么要学习它？关于本书先决条件数学态度编码数学证明与来自编码的直觉代码，印在书中，可在线下载代码练习如何使用本书（供教师和自学者使用）
2.载体，第一部分
在 NumPy 中创建和可视化向量向量几何学向量运算添加两个向量矢量加减法的几何原理矢量-标量乘法标量-矢量加法移调用 Python 进行矢量广播矢量幅度和单位矢量矢量点积点积具有分配性点积几何其他矢量乘法哈达玛乘法外层产品交叉和三重产品正交向量分解摘要代码练习
3.载体，第二部分
矢量集线性加权组合线性独立性线性独立的数学独立性和零点向量子空间和跨度基础基础的定义摘要代码练习
4.矢量应用
相关性和余弦相似性时间序列过滤和特征检测k-均值聚类代码练习相关练习筛选和特征检测练习k-均值练习
5.矩阵，第一部分
在 NumPy 中创建和可视化矩阵可视化、索引和切分矩阵特殊矩阵矩阵数学加法、标量乘法、哈达玛乘法加法和减法"转换 "矩阵标量乘法和哈达玛乘法标准矩阵乘法矩阵乘法有效性规则矩阵乘法矩阵-矢量乘法矩阵运算：转置点积和外积符号矩阵行动：活生生的邪恶（行动顺序）对称矩阵从非对称矩阵创建对称矩阵摘要代码练习
6.矩阵，第二部分
矩阵规范矩阵轨迹和弗罗贝尼斯规范矩阵空间（列、行、空）立柱空间行间距无效空间等级特殊矩阵的秩添加矩阵和乘法矩阵的秩移位矩阵的秩理论与实践等级申请在专栏空间？向量集的线性独立性决定因素计算行列式线性相关的决定因素特征多项式摘要代码练习
7.矩阵应用
多变量数据协方差矩阵通过矩阵-矢量乘法实现几何变换图像特征检测摘要代码练习协方差和相关矩阵练习几何变换练习图像特征检测练习
8.矩阵逆
矩阵逆反演类型和反演条件计算倒数2 × 2 矩阵的倒数对角矩阵的逆反转任意方形全角矩阵单边逆倒数是唯一的摩尔-彭罗斯伪逆反演的数值稳定性倒数的几何解释摘要代码练习
9.正交矩阵和 QR 分解
正交矩阵克-施密特QR 分解Q 和 R 的大小QR 和倒数摘要代码练习

10.减少行数和 LU 分解
方程组将方程转换为矩阵使用矩阵方程减少行数高斯消除高斯-乔丹消除法通过高斯-乔丹消除进行矩阵求逆路分解通过排列矩阵进行行交换摘要代码练习
11.一般线性模型和最小二乘法
一般线性模型术语建立一般线性模型求解 GLM解决方案精确吗？最小二乘法的几何视角为什么最小二乘法有效？一个简单例子中的 GLM通过 QR 实现最小二乘法摘要代码练习
12.最小二乘法应用
根据天气预测自行车租赁情况使用 statsmodels 的回归表多重共线性规范化多项式回归网格搜索查找模型参数摘要代码练习自行车租赁练习多重共线性练习规范化练习多项式回归练习网格搜索练习
13.超显分解
特征值和特征向量的解释几何学统计（主成分分析）降低噪音降维（数据压缩）查找特征值查找特征向量特征向量的符号和尺度不确定性方形矩阵对角线化对称矩阵的特殊魅力正交特征向量实值特征值奇异矩阵的多重分解二次型、确定性和特征值矩阵的二次方形式明确性 T 𝐀 是正（半）定值广义英根分解摘要代码练习
14.奇异值分解
SVD 的全貌奇异值与矩阵秩Python 中的 SVD矩阵的 SVD 和 Rank-1 "层来自 EIG 的 SVD𝐀 T 𝐀 的 SVD将奇异值转换为方差，详解状态编号SVD 和 MP 伪逆摘要代码练习
15.特征分解和 SVD 应用
使用 Eigendecomposition 和 SVD 的 PCAPCA 的数学执行 PCA 的步骤通过 SVD 进行 PCA线性判别分析通过 SVD 进行低链逼近用于去噪的 SVD摘要练习PCA线性判别分析低库近似的 SVD用于图像去噪的 SVD
16.Python 教程
为什么选择 Python，有哪些替代方案？集成开发环境（交互式开发环境）本地和在线使用 Python在 Google Colab 中处理代码文件变量数据类型索引功能方法即函数编写自己的函数图书馆NumPyNumPy 中的索引和切片可视化将公式转化为代码打印格式和 F 字符串控制流比较如果语句For 循环嵌套控制语句测量计算时间获取帮助和了解更多信息出现问题时该怎么办摘要
索引
关于作者

Content preview from 数据科学中的实用线性代数

第 14 章奇异值分解奇异值分解

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

上一章的内容非常密集！我尽力让它变得易懂、严谨，同时又不纠缠于与数据科学关系不大的细节。

幸运的是，你所学到的关于幂等分解的大部分知识都适用于 SVD。这意味着本章将变得更简单、更简短。

SVD 的目的是将矩阵分解为三个矩阵的乘积，即左奇异向量 ( $𝐔$ ）、奇异值 ( $Σ$ ) 和右奇异向量 ( $𝐕$ ):

A = U Σ V^{T}

这种分解看起来应该与 "秭归分解 "类似。事实上，你可以将 SVD 视为 eigendecomposition 对非方阵矩阵的推广，或者将 eigendecomposition 视为 SVD 对方阵矩阵的特例。¹

奇异值相当于特征值，而奇异向量矩阵相当于特征向量（这两组量在某些情况下是相同的，我稍后会解释）。

SVD 的全貌

我想先向大家介绍矩阵的概念和解释，然后在本章后面的内容中介绍如何计算 SVD。

图 14-1显示了 SVD 的概览。

从这张图中可以看到 SVD 的许多重要特征；我将在本章中详细介绍这些特征，，但要把它们列成一个清单：

都是 $𝐔$ 和 $𝐕$ 都是正方形矩阵，即使 $𝐀$ 也是非正方形矩阵。
奇异向量的矩阵 $𝐔$ 和 $𝐕$ 是正交的，即 $𝐔^{T} 𝐔 = 𝐈$ 和 $𝐕^{T} 𝐕 = 𝐈$ .提醒一下，这意味着每一列与其他每一列都是正交的，而且任何一列的子集都与其他任何一列（非重叠）的子集是正交的。
的前r列 $𝐔$ 的列空间提供正交基向量。 $𝐀$ 的列空间提供正交基向量，而其余列则为左空空间提供正交基向量（除非r=M，在这种情况下，矩阵为全列秩，左空空间为空）。
的前r行 $𝐕^{T}$ 的列 $𝐕$ 为行空间提供正交基向量，其余各行为空空间提供正交基向量。
奇异值矩阵是一个对角矩阵，其大小与 $𝐀$ .奇异值总是从大（左上角）到小（右下角）排序。
所有奇异值都是非负的实值。即使矩阵包含复数值，它们也不能是复数或负数。
非零奇异值的数量等于矩阵秩。

SVD 最神奇的地方或许在于它揭示了矩阵的所有四个子空间：𝐔的前r列和最后M-r列跨越了列空间和左空空间。 $𝐔$ 的前r列和最后N-r列跨越行空间和空空间。 $𝐕^{T}$ .对于矩形矩阵，如果r=M，则左空空间为空；如果r=N，则空空间为空。

奇异值与矩阵秩

矩阵的秩定义为非零奇异值的个数。原因来自前面的讨论，即矩阵的列空间和行空间被定义为左奇异矢量和右奇异矢量，它们通过相应奇异值的缩放在矩阵空间中具有一定的 "体积"，而左空空间和右空空间被定义为缩放为零的左奇异矢量和右奇异矢量。因此，列和行空间的维度取决于非零奇异值的数量。

事实上，我们可以窥探 NumPy 函数np.linalg.matrix_rank ，看看 Python 是如何计算矩阵秩的（我对代码稍作了编辑，以突出关键概念）：

S = svd(M,compute_uv=False) # return only singular values
tol = S.max() * max(M.shape[-2:]) * finfo(S.dtype).eps
return count_nonzero ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341657236

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business