15章k-最近傍法
レシピ15.0 はじめに
k-最近傍法(KNN:k-Nearest Neighbors)クラス分類器は、教師あり機械学習クラス分類器の中で、最も単純だが、最も広く用いられている手法だ。KNNは、遅延学習器(lazy learner)の1つで、予測のための訓練を行わない。観測値は、周辺にあるk個の観測値の多数が占めるクラスであると予測される。例えば、クラスのわからないある観測値が、クラス1の観測値に囲まれていた場合には、クラス1に分類する。本章では、scikit-learnを使ってKNNクラス分類器を作成し、利用する方法を説明する。
レシピ15.1 観測値の近傍の発見
問題
ある観測値に対して、最も近くにある観測値(最近傍値)をk個見つけたい。
解決策
scikit-learnのNearestNeighbors
を用いる。
# ライブラリをロード from sklearn import datasets from sklearn.neighbors import NearestNeighbors from sklearn.preprocessing import StandardScaler # データをロード iris = datasets.load_iris() features = iris.data # 標準化器を作成 standardizer = StandardScaler() # 特徴量を標準化 features_standardized = standardizer.fit_transform(features) # 2-最近傍法 nearest_neighbors = NearestNeighbors(n_neighbors=2).fit(features_standardized) ...
Get Python機械学習クックブック now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.