Skip to Content
Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
book

Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

by Jake VanderPlas, 菊池 彰
February 2024
Intermediate to advanced
576 pages
9h 17m
Japanese
O'Reilly Japan, Inc.
Content preview from Pythonデータサイエンスハンドブック 第2版 ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

41章詳細:ナイーブベイズ分類

これまでの4つの章で、機械学習の概念を説明しました。この章以降は、4つの教師あり学習のアルゴリズムと4つの教師なし学習のアルゴリズムについて詳しく説明します。まず、教師あり学習アルゴリズムの1つ目、ナイーブベイズ分類から始めます。

ナイーブベイズモデルは高速で簡単な一連の分類アルゴリズムであり、多くの場合、高い次元のデータセットに適しています。このアルゴリズムは非常に高速であり、調整可能なパラメータが少ないため、分類問題の最初の一手として有用です。この章では、ナイーブベイズ分類器がどのように動作するかを直感的に説明し、いくつかのデータセットで使用した例を示します。

41.1 ベイズ分類

ナイーブベイズ分類器(Naive Bayes classifiers)はベイズ分類法に基づいて作られています。これは統計量に対する条件付き確率の関係を説明するベイズの定理に依存しています。ベイズ分類では、ある特徴量(features)が観測された際に、そのラベルがLである確率に興味があります。これをP(L | features)と記述します。ベイズの定理は、これを直接的に計算できる量から求める方法を与えます。

[eq_410]

2つのラベル(ここではL1L2としましょう)を決定することを考えます。1つの方法は各ラベルの事後確率P(L|features)の比を計算することです。

ここで必要なのは、各ラベルに対するを計算するモデルです。このようなモデルは、データを生成する仮想的なランダム過程を指定するため、 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Pythonデータサイエンスハンドブック ―Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習

Jake VanderPlas, 菊池 彰
推薦システム実践入門 ―仕事で使える導入ガイド

推薦システム実践入門 ―仕事で使える導入ガイド

風間 正弘, 飯塚 洸二郎, 松村 優也
プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

プロダクトマネージャーのしごと 第2版 ―1日目から使える実践ガイド

Matt LeMay, 永瀬 美穂, 吉羽 龍太郎, 原田 騎郎, 高橋 一貴

Publisher Resources

ISBN: 9784814400638Publisher Website