仕事ではじめる機械学習 第2版

Book description

2018年の発行以来、多くの読者に支持された書籍を全面改訂! 不確実性の高い機械学習プロジェクトについて、「仕事で使う」という観点から整理するコンセプトはそのままに、初版の発行後に登場した概念や課題を取り上げます。「機械学習でいい感じにしてくれ」と突然上司に言われたとき、本書で学んだことが読者の力になるはずです。本書で得た知識は読者が「いま」困っている問題を解決する助けとなるでしょう。 第2版では、機械学習システムの開発と運用の統合する「ML Ops」、機械学習モデルを解釈し、その妥当性や根拠を明らかにする「機械学習モデルの検証」、ユーザーの行動を学習しながら予測を進める「バンディットアルゴリズム」、意思決定における予測システムの役割や意思決定のデザインを扱う「オンライン広告での機械学習」といった新章を追加しています。

Table of contents

  1. 大扉
  2. 著作権表記
  3. 目次
  4. まえがき
    1. 本書の扱っている内容
    2. 本書で扱っていない内容
    3. 本書が前提としている内容
    4. 本書の構成
    5. 意見と質問
    6. 表記上のルール
    7. サンプルコードの使用について
  5. 第1部
    1. 機械学習プロジェクトのはじめ方
      1. 機械学習はどのように使われるのか
      2. 機械学習プロジェクトの流れ
      3. 実システムにおける機械学習の問題点への対処方法
      4. 機械学習を含めたシステムを成功させるには
      5. この章のまとめ
    2. 機械学習で何ができる?
      1. どのアルゴリズムを選ぶべきか?
      2. 分類
      3. 回帰
      4. クラスタリング・次元削減
      5. その他
      6. この章のまとめ
    3. 学習結果を評価するには
      1. 分類の評価
      2. 回帰の評価
      3. 機械学習を組み込んだシステムのA/Bテスト
      4. この章のまとめ
    4. システムに機械学習を組み込む
      1. システムに機械学習を含める流れ
      2. システム設計
      3. 教師データを取得するためのログ設計
      4. この章のまとめ
    5. 学習のためのリソースを収集する
      1. 学習のためのリソースの取得方法
      2. 公開されたデータセットやモデルを活用する
      3. 開発者自身が教師データを作る
      4. 同僚や友人などにデータ入力してもらう
      5. クラウドソーシングを活用する
      6. サービスに組み込み、ユーザーに入力してもらう
      7. この章のまとめ
    6. 継続的トレーニングをするための機械学習基盤
      1. 機械学習システム特有の難しさ
      2. 継続的トレーニングとML Ops
      3. 機械学習基盤のステップ
      4. 予測結果のサービングを継続し続けるために
      5. この章のまとめ
    7. 効果検証:機械学習にもとづいた施策の成果を判断する
      1. 効果検証の概要
      2. 因果効果の推定
      3. 仮説検定の枠組み
      4. A/Bテストの設計と実施
      5. オフライン検証
      6. A/Bテストができないとき
      7. この章のまとめ
      8. こぼれ話:絶対に成功するA/Bテスト、A/Bテストの母集団ハック
    8. 機械学習のモデルを解釈する
      1. Google Colaboratoryにインストールされているライブラリをバージョンアップする
      2. 学習用のファイルをアップロードして確認する
      3. 線形回帰の係数から原因を読み解く
      4. ロジスティック回帰の係数から原因を読み解く
      5. 回帰係数のp値を求める
      6. 決定木の可視化から原因を読み解く
      7. ランダムフォレストのFeature Importanceの可視化
      8. SHAPによる寄与の可視化
      9. 従業員満足度をSHAPで可視化する
      10. この章のまとめ
  6. 第2部
    1. Kickstarterの分析、機械学習を使わないという選択肢
      1. KickstarterのAPIを調査する
      2. Kickstarterのクローラーを作成する
      3. JSONデータをCSVに変換する
      4. Excelで軽く眺めてみる
      5. ピボットテーブルで色々と眺めてみる
      6. 達成したのにキャンセルされたプロジェクトを見てみる
      7. 国別に見てみる
      8. レポートを作る
      9. 今後行いたいこと
      10. この章のまとめ
    2. Uplift Modelingによるマーケティング資源の効率化
      1. Uplift Modelingの四象限のセグメント
      2. A/Bテストの拡張を通じたUplift Modelingの概要
      3. Uplift Modelingのためのデータセット生成
      4. 2つの予測モデルを利用したUplift Modeling
      5. Uplift Modelingの評価方法、AUUC
      6. 実践的な問題での活用
      7. Uplift Modelingを本番投入するには
      8. この章のまとめ
    3. バンディットアルゴリズムによる強化学習入門
      1. バンディットアルゴリズムの用語の整理
      2. 確率分布の考え方
      3. 事後分布の考え方
      4. 事後分布の信用区間上限を用いた実装例
      5. UCB1
      6. 確率的なバンディットアルゴリズム
      7. 各種バンディットアルゴリズムの比較
      8. 文脈付き多腕バンディットのブートストラップ法による実装
      9. 現実の問題での課題
      10. バンディットアルゴリズムと、A/Bテスト、Uplift Modelingの関係性
      11. この章のまとめ
    4. オンライン広告における機械学習
      1. オンライン広告のビジネス設定
      2. 問題の定式化
      3. 予測の役割と実装
      4. 広告配信ログの特徴
      5. 機械学習予測モデルの運用
      6. この章のまとめ
  7. あとがき
    1. 謝辞
  8. 参考文献
  9. 著者紹介
    1. 有賀康顕
    2. 中山心太
    3. 西林孝
  10. カバーの説明
  11. 奥付

Product information

  • Title: 仕事ではじめる機械学習 第2版
  • Author(s): 有賀 康顕, 中山 心太, 西林 孝
  • Release date: April 2021
  • Publisher(s): O'Reilly Japan, Inc.
  • ISBN: 9784873119472

You might also like

book

プログラミングRust 第2版

by Jim Blandy, Jason Orendorff, Leonora F. S. Tindall, 中田 秀基

次世代ブラウザ開発用にMozillaによって開発されたRustは、C/C++並みのパフォーマンスと低レベルの制御能力に加え、メモリとスレッドの安全性を担保し、さらに並行性にも優れるといった特徴を持つ、優秀な言語です。本書はMozillaで実際にRustを使ってFirefoxを開発している著者らによる、言語の概要と用途について解説する書籍で、Rustのほとんどの機能を詳細にカバーします。Rustのメジャーバージョンアップにより非同期処理が可能となったことに対応し、第2版では新たに非同期処理の章を設け、この機能を詳細に解説しています。Rust 2021対応。

book

Rクックブック 第2版

by J.D. Long, Paul Teetor, 大橋 真也, 木下 哲也

Rを使って統計解析、グラフィックス作成、データ分析などを行う際に、頻繁に遭遇すると思われる約300の問題とその解決策を収録したレシピ集です。RとRStudioのインストール、言語仕様、基本操作などの基礎的なことから、高度なプログラミングテクニックやさまざまな回帰分析の種類とその使い方まで、扱う内容は多岐にわたります。初心者にとっては、環境設定や文法、入出力などでつまずきやすいポイントを的確にフォロー。中級者以上にとっては日々の作業をより生産的、効率的にする「使える」レシピを多数用意しています。リファレンスとして手元に置いておきたい、Rユーザ必携の一冊です。

book

詳解 システム・パフォーマンス 第2版

by Brendan Gregg, 西脇 靖紘, 長尾 高弘

本書は、エンタープライズとクラウド環境を対象としたオペレーティングシステムとアプリケーションのパフォーマンス分析と向上について解説します。 主にLinuxベースのオペレーティングシステムに含まれるツールとその使用例を通じてシステムパフォーマンスを引き出す手法を説明します。システム評価のためのベンチマーク、キャパシティプランニング、ボトルネックの解消について解説しスケーラビリティを制限する要因を発見、分析し、解決する方法を学びます。 第2版では、perf、Ftrace、BPFの解説が加わり、Linuxとクラウドコンピューティングについての説明が充実しました。 システムのパフォーマンスを向上させ、コストを削減し、レイテンシの外れ値を減らすための方法を学ぶ本書はエンジニア必携の一冊です。

book

機械学習システムデザイン ―実運用レベルのアプリケーションを実現する継続的反復プロセス

by Chip Huyen, 江川 崇, 平山 順一

ビジネスとしての機械学習システムの設計や運用についての解説書。本書では、機械学習の最前線で活躍する著者の豊富な経験と知識に基づき、エンド・ツー・エンドの機械学習システムを設計・構築するための基本原則を明らかにします。訓練データの処理方法、特徴の使い方、モデルを再訓練する頻度、監視すべき項目……このような設計上の決定がシステム全体の目的達成にどのように寄与するのかを、実際のケーススタディを通じて理解します。機械学習プロジェクトを成功に導く上で必要な信頼性、拡張性、保守性、およびビジネス要件の変化への適応性を備えた機械学習システムを設計する包括的なアプローチを本書で学ぶことができます。