Skip to Content
機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決
book

機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決

by Valliappa Lakshmanan, Sara Robinson, Michael Munn, 鷲崎 弘宜, 竹内 広宜, 名取 直毅, 吉岡 信和
October 2021
Beginner to intermediate
414 pages
6h 25m
Japanese
O'Reilly Japan, Inc.
Content preview from 機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決

2章データ表現のパターン

あらゆる機械学習モデルの核心的な点は、特定のデータのみで機能する数学的関数であるということです。一方で、現実の機械学習モデルはしばしば、数学的関数へと直接には入力できないデータ上での動作が求められます。例えば決定木の数学的な核心部分は論理型(boolean)の変数に従って動作します。決定木の機械学習ソフトウェアには通常、他にもさまざまな関数が含まれます。データから最適な木を学習し、異なる種別の数値データとカテゴリ型データを読み込み、処理する方法を学習する関数などです。しかし、決定木の根幹を支える数学的関数(図2-1を参照)は、論理型の変数上で動作し、AND演算(図2-1における&&)やOR演算(図2-1における+)などの演算を用います。

新生児の集中治療の要否を予測する決定木モデルの核心部分は、論理型変数の上で機能する数学的モデルになる

図2-1 新生児の集中治療の要否を予測する決定木モデルの核心部分は、論理型変数の上で機能する数学的モデルになる

新生児の集中治療(IC)もしくは通常通りの退院(ND)を予測する決定木を考えます。決定木は、2つの変数x1およびx2を入力としてとるものとします。訓練済みモデルは図2-1に示すようなものとなるでしょう。

f(x1, x2)が機能するためには、x1およびx2は論理型変数でなければなりません。新生児の集中治療の要否を分類する際に、モデルに考慮させたい情報は、新生児が生まれた病院と体重です。ここで、新生児が生まれた病院を、決定木の入力としては使用できません。病院という情報はTrue(真)またはFalse(偽)のいずれの値もとらず、&&(AND)演算子に与えられないためです。つまり、数学的に適合しません。もちろん、以下のような操作により病院の値を論理型に変換できます。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

プログラミング・ビットコイン ―ゼロからビットコインをプログラムする方法

プログラミング・ビットコイン ―ゼロからビットコインをプログラムする方法

Jimmy Song, 中川 卓俊, 住田 和則, 中村 昭雄, 星野 靖子
情報アーキテクチャ 第4版 ―見つけやすく理解しやすい情報設計

情報アーキテクチャ 第4版 ―見つけやすく理解しやすい情報設計

Louis Rosenfeld, Peter Morville, Jorge Arango, 篠原 稔和, 岡 真由美
行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

行動を変えるデザイン ―心理学と行動経済学をプロダクトデザインに活用する

Stephen Wendel, 武山 政直, 相島 雅樹, 反中 望, 松村 草也
戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

Foster Provost, Tom Fawcett, 竹田 正和, 古畠 敦, 瀬戸山 雅人, 大木 嘉人, 藤野 賢祐, 宗定 洋平, 西谷 雅史, 砂子 一徳, 市川 正和, 佐藤 正士

Publisher Resources

ISBN: 9784873119564Other