仕事ではじめる機械学習 第2版

Book description

2018年の発行以来、多くの読者に支持された書籍を全面改訂! 不確実性の高い機械学習プロジェクトについて、「仕事で使う」という観点から整理するコンセプトはそのままに、初版の発行後に登場した概念や課題を取り上げます。「機械学習でいい感じにしてくれ」と突然上司に言われたとき、本書で学んだことが読者の力になるはずです。本書で得た知識は読者が「いま」困っている問題を解決する助けとなるでしょう。 第2版では、機械学習システムの開発と運用の統合する「ML Ops」、機械学習モデルを解釈し、その妥当性や根拠を明らかにする「機械学習モデルの検証」、ユーザーの行動を学習しながら予測を進める「バンディットアルゴリズム」、意思決定における予測システムの役割や意思決定のデザインを扱う「オンライン広告での機械学習」といった新章を追加しています。

Table of contents

  1. 大扉
  2. 著作権表記
  3. 目次
  4. まえがき
    1. 本書の扱っている内容
    2. 本書で扱っていない内容
    3. 本書が前提としている内容
    4. 本書の構成
    5. 意見と質問
    6. 表記上のルール
    7. サンプルコードの使用について
  5. 第1部
    1. 機械学習プロジェクトのはじめ方
      1. 機械学習はどのように使われるのか
      2. 機械学習プロジェクトの流れ
      3. 実システムにおける機械学習の問題点への対処方法
      4. 機械学習を含めたシステムを成功させるには
      5. この章のまとめ
    2. 機械学習で何ができる?
      1. どのアルゴリズムを選ぶべきか?
      2. 分類
      3. 回帰
      4. クラスタリング・次元削減
      5. その他
      6. この章のまとめ
    3. 学習結果を評価するには
      1. 分類の評価
      2. 回帰の評価
      3. 機械学習を組み込んだシステムのA/Bテスト
      4. この章のまとめ
    4. システムに機械学習を組み込む
      1. システムに機械学習を含める流れ
      2. システム設計
      3. 教師データを取得するためのログ設計
      4. この章のまとめ
    5. 学習のためのリソースを収集する
      1. 学習のためのリソースの取得方法
      2. 公開されたデータセットやモデルを活用する
      3. 開発者自身が教師データを作る
      4. 同僚や友人などにデータ入力してもらう
      5. クラウドソーシングを活用する
      6. サービスに組み込み、ユーザーに入力してもらう
      7. この章のまとめ
    6. 継続的トレーニングをするための機械学習基盤
      1. 機械学習システム特有の難しさ
      2. 継続的トレーニングとML Ops
      3. 機械学習基盤のステップ
      4. 予測結果のサービングを継続し続けるために
      5. この章のまとめ
    7. 効果検証:機械学習にもとづいた施策の成果を判断する
      1. 効果検証の概要
      2. 因果効果の推定
      3. 仮説検定の枠組み
      4. A/Bテストの設計と実施
      5. オフライン検証
      6. A/Bテストができないとき
      7. この章のまとめ
      8. こぼれ話:絶対に成功するA/Bテスト、A/Bテストの母集団ハック
    8. 機械学習のモデルを解釈する
      1. Google Colaboratoryにインストールされているライブラリをバージョンアップする
      2. 学習用のファイルをアップロードして確認する
      3. 線形回帰の係数から原因を読み解く
      4. ロジスティック回帰の係数から原因を読み解く
      5. 回帰係数のp値を求める
      6. 決定木の可視化から原因を読み解く
      7. ランダムフォレストのFeature Importanceの可視化
      8. SHAPによる寄与の可視化
      9. 従業員満足度をSHAPで可視化する
      10. この章のまとめ
  6. 第2部
    1. Kickstarterの分析、機械学習を使わないという選択肢
      1. KickstarterのAPIを調査する
      2. Kickstarterのクローラーを作成する
      3. JSONデータをCSVに変換する
      4. Excelで軽く眺めてみる
      5. ピボットテーブルで色々と眺めてみる
      6. 達成したのにキャンセルされたプロジェクトを見てみる
      7. 国別に見てみる
      8. レポートを作る
      9. 今後行いたいこと
      10. この章のまとめ
    2. Uplift Modelingによるマーケティング資源の効率化
      1. Uplift Modelingの四象限のセグメント
      2. A/Bテストの拡張を通じたUplift Modelingの概要
      3. Uplift Modelingのためのデータセット生成
      4. 2つの予測モデルを利用したUplift Modeling
      5. Uplift Modelingの評価方法、AUUC
      6. 実践的な問題での活用
      7. Uplift Modelingを本番投入するには
      8. この章のまとめ
    3. バンディットアルゴリズムによる強化学習入門
      1. バンディットアルゴリズムの用語の整理
      2. 確率分布の考え方
      3. 事後分布の考え方
      4. 事後分布の信用区間上限を用いた実装例
      5. UCB1
      6. 確率的なバンディットアルゴリズム
      7. 各種バンディットアルゴリズムの比較
      8. 文脈付き多腕バンディットのブートストラップ法による実装
      9. 現実の問題での課題
      10. バンディットアルゴリズムと、A/Bテスト、Uplift Modelingの関係性
      11. この章のまとめ
    4. オンライン広告における機械学習
      1. オンライン広告のビジネス設定
      2. 問題の定式化
      3. 予測の役割と実装
      4. 広告配信ログの特徴
      5. 機械学習予測モデルの運用
      6. この章のまとめ
  7. あとがき
    1. 謝辞
  8. 参考文献
  9. 著者紹介
    1. 有賀康顕
    2. 中山心太
    3. 西林孝
  10. カバーの説明
  11. 奥付

Product information

  • Title: 仕事ではじめる機械学習 第2版
  • Author(s): 有賀 康顕, 中山 心太, 西林 孝
  • Release date: April 2021
  • Publisher(s): O'Reilly Japan, Inc.
  • ISBN: 9784873119472