9章分類モデルとデータ解析

よく考えた結果であれば後悔が少ない。

—— Amelia E. Barr

得られたデータをただモデルに与えればそれで終わりではありません。ニューラルネットワークは、人間が反射的に反応するのと同じような形で、高速に反応して複雑な計算を実行します。しかし、人間の場合も機械学習モデルの場合も、その反応に理論的な判断は含まれません。乱雑で複雑なデータから得られるのは結局、役に立たないモデルです。本章ではTensorFlow.jsでのデータの識別や読み込み、クリーニング、強化のプロセスについて学び、モデルの訓練結果の正解率を改善します。

本章の内容は以下のとおりです。

  • 分類モデルを作成する方法を確認します
  • CSVデータを扱う方法を学びます
  • Danfo.jsとデータフレームについて学びます
  • 乱雑なデータを整理(データラングリング)して訓練に使用する方法を確認します
  • データのグラフ化と解析を練習します
  • 機械学習用のノートブックについて学びます
  • 特徴量エンジニアリングの中心的なコンセプトを明らかにします

本章を読み終えると、大量データを収集、解析することや、コンテキストに基づく直感を確認してモデルの訓練の役に立つ特徴量を作成することに自信を持てるようになるでしょう。

本章では、タイタニック生存分類器を構築します。3等チケットを持つ30歳未婚の女性、Kate Connollyさんは生き残れるでしょうか? ある乗客に関する情報を受け取り、その乗客が生き残る可能性を返すようにモデルを訓練しましょう。

9.1 分類モデル

先ほど自分で訓練したモデルは単純な数値を求めるだけでした。しかしそれ以前の章で利用していたモデルの多くは、そのように単純なモデルではありませんでした。「 ...

Get 初めてのTensorFlow.js ―JavaScriptで学ぶ機械学習 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.