Skip to Content
精通特征工程
book

精通特征工程

by Alice Zheng, Amanda Casari
April 2019
Intermediate to advanced
172 pages
4h 39m
Chinese
Posts & Telecom Press
Content preview from 精通特征工程
线性建模与线性代数基础
153
数据解释:
不能表示为现有数据点的线性组合的“奇异”数据点。
基:
对应于
0
奇异值的右奇异向量(
V
中的其余列)。
4
.
左零空间
数学定义:
输入向量
u
的集合,其中
u
满足
u
T
A
= 0
数学解释:
A
中所有列都正交的向量集合。左零空间与列空间是正交的。
数据解释:
不能表示为现有特征的线性组合的“奇异特征向量”。
基:
对应于
0
奇异值的左奇异向量(
U
中的其余列)。
列空间与行空间中的向量是能够被当前观测到的数据和特征表示出来的向量。列空间中的
向量是非奇异的特征,行空间中的向量是非奇异的数据点。
对于建模和预测目的,非奇异是一件好事。一个满秩的列空间意味着特征集合中包含着足
够的信息,可以对任何需要的目标向量进行建模。一个满秩的行空间意味着各个不同的数
据点中包含着足够的变异,可以覆盖特征空间的各个角落。那些奇异的数据点和特征(分
别位于零空间和左零空间中)才是我们需要担心的。
在为数据建立线性模型的应用中,零空间也可以看作“奇异”数据点的子空间。在这里,
奇异性不是什么好事情。奇异的数据点表示那些不能被训练集线性表示的虚幻数据。同
样,左零空间中包含的是不能表示为现有特征的线性组合的奇异特征。
零空间与行空间是正交的。原因很简单,从零空间的定义可知,
w
A
中所有行向量的内
积都是
0
。因此,
w
与这些行向量张成的空间(也就是行空间)是正交的。同样,左零空
间与列空间也是正交的。
A.3
 线性系统求解
让我们把这些数学知识应用到当前的问题中:训练线性分类器,这个问题与线性系统求解
联系得非常紧密。我们深入研究了矩阵操作的原理,因为要对其进行逆向工程 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

精通機器學習

精通機器學習

Aurélien Géron

Publisher Resources

ISBN: 9787115509680