다. 이는 행렬 분해에 랜덤 샘플링 이론을 더한 효율적인 방법이다. 무작위성의 수치적 방법은
결정론적 방법보다 훨씬 연산 비용이 저렴하면서도 정확한 행렬 분해를 할 수 있는 놀라운 성
능을 발휘한다.
랜덤 특이값 분해
는 큰 데이터 행렬
X
의 열 공간을 샘플링하고 샘플링된(훨씬 작
은) 행렬에 대해
QR
분해를 계산해
X
를 더 작은 공간에 투영한다(
Y
=
Q
t
X
이고
XQY.
).
그런 다음
Y
의 특이값 분해를 계산한다(
Y
=
U
/
V
t
). 행렬
Q
는 직교 정규화되어 있으며
X
의
열 공간을 근사하므로 행렬
/
와
V
는 각각
X
,
Y
와 동일하다. 즉,
X
의
U
를 찾으려면
Y
와
Q
의
U
로부터 계산할 수 있다(
QU
X
=
QU
Y
).
정리하기
Chapter
6
의 핵심은 다음과 같다.
UUVUVUVX
t
col
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.