Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
254 9 線形回帰とロジスティック回帰
に相関している。しかし、完全に相関している特徴を追加しても、予測に役立つ情報は増えないので、どち
らかは不要だ。このような重複する特徴に意味があるのなら、データ行列の列のコピーを追加するだけでよ
り正確なモデルが得られることになってしまう。
しかし、相関する特徴は、役に立たないだけでなく、モデルにとって有害ともなる。従属変数が身長の関
数だ
ったとする。x
1
だけを使っても、x
2
だけを使っても、x
1
x
2
の線形結合を使っても同じくらいに性
能の高いモデルが得られる。それでは、答えとしてどれを選べばよいのだろうか。
これは紛らわしいというだけだが、もっとまずい問題が起こる。共分散行列の行が相互依存するようにな
るので、w = (A
T
A)
1
A
T
b を計算するために、特異行列の逆行列を求める必要があるが、特異行列には逆
行列が存在しないので無理な話である。
この問題を解決するには、適切な共分散行列を計算して、過度に相関し合う特徴の対を明らかにする必要
がある。そういうものがある場合、どちらか片方を削除しても、予測力はほとんど下がらない。相関の高い
特徴の一方を、もう一方の特徴で表すこと省略するならなお良い。この問題は、8.5.1 節で説明した特異値
分解などの技法を使って次元削減することによって解消できる。
9.3 私の体験談から:タクシー 
デリバー
配達 
私には人生で誇りに思うことがたくさんあるが、おそらく最大の誇りはニューヨーカーであることだ。私
は世界で最も刺激的な街、つまり宇宙の真の中心に住んでいるのである。そんな天文学者たちは、タイムズ ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other