Skip to Content
データサイエンス設計マニュアル
book

データサイエンス設計マニュアル

by Steven S. Skiena, 小野 陽子, 長尾 高弘
January 2020
Beginner to intermediate
728 pages
10h 26m
Japanese
O'Reilly Japan, Inc.
Content preview from データサイエンス設計マニュアル
94 4 スコアとランキング
数に重みを付ければ、さらによいスコアリング関数になる。しかし、それほど大きな差が生まれるこ
とはないはずだ。
意味のある形で差をつける:同点がいくつも出るようでは、ランキング関数のありがたみはかなり失
われ
る。人の指の本数のランキング関数は意味がないだろう。ごく一部のみが 12 本だが、大多数は
10 本で、事故などで 10 本よりも少ない人々がごくわずかいるというよう状況になってしまう。
一般に、スコアは同点になる確率を下げるために、適正な範囲の実数にすべきだ。差別化のために、
注目している性質と相関している副次的な特徴を導入するとよい。
4.3 Z スコアと正規化
モデルを正しく機能させるためには、できる限り簡単にすべきであるというのは、データサイエンスの重
要な原則である。線形回帰のような機械学習技法は、与えられたデータセットに最もよくフィットする直線
を見つけるものとされている。しかし、複数の変数を使って何かにフィットさせようと思うなら、その前に
それらの変数の範囲と分布を正規化することが大切である。
主な正規化方法は、Z スコアZ-変換)である。Z スコアは、次のように計算する。ただし、µ は分布の
平均、σ は標準偏差である。
Z
i
= (a
i
µ)
Z スコアは、正規化を考えずに集められた変数を変換して一様な範囲に揃える。インチ単位で測定された
身長の Z スコアは、マイル単位で測定された身長の Z スコアとまったく同じになる。そして、すべての点
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Python機械学習クックブック

Python機械学習クックブック

Chris Albon, 中田 秀基
Rではじめるデータサイエンス

Rではじめるデータサイエンス

Hadley Wickham, Garrett Grolemund, 黒川 利明, 大橋 真也
プログラミングC# 第8版

プログラミングC# 第8版

Ian Griffiths, 木下 哲也, 鈴木 幸敏

Publisher Resources

ISBN: 9784873118918Other