8章パターンのつながり
本書では、機械学習モデルや機械学習パイプラインの設計、訓練、デプロイにあたり繰り返し発生する問題と解決策を機械学習デザインパターンとしてカタログ化してきました。本章では、紹介してきた全パターンの早見ガイドを掲載します。
本書ではパターンを、典型的な機械学習のワークフロー中で用いる個々の段階や箇所の観点で整理してきました。最初に、入力のデータ表現を説明した上で、モデルの選択を取り上げました。次に、典型的な訓練ループを変更し、推論と運用をより対応的なものとするパターンを説明しました。最後に、機械学習システムの責任ある利用に寄与するパターンを紹介しました。これは料理レシピ本の構成として、前菜、スープ、デザートのそれぞれを独立した章で扱うことに似ています。しかしその構成では、スープを選択すべき場合や、メインディッシュに合うデザートを判断することが困難です。そこで本章では、各パターンの関係を説明します。さらに、典型的な機械学習タスクにおけるパターンの相互作用を考察し、「献立」を組み立てます。
8.1 パターンの一覧
前章まででさまざまなデザインパターン、ならびに、機械学習における一般的な問題への対処におけるパターンの役割を説明してきました。概要を以下にまとめます。
章 | デザインパターン | 問題 | 解決 |
---|---|---|---|
データ表現 | 特徴量ハッシュ | カテゴリ型特徴量に関連する問題(不完全な語彙、値の種類の多さに伴うモデルの大きさ、コールドスタートなど) | 文字列表現の決定的かつ可搬性のあるハッシュをバケット化し、データ表現における衝突のトレードオフを許容 |
データ表現 | 埋め込み | 値の種類が多く、関係性の近さの保持が重要な特徴量 | 問題上で関係のある情報が保持されるように、値の種類が多いデータを低次元の空間にマッピングするデータ表現を学習 ... |
Get 機械学習デザインパターン ―データ準備、モデル構築、MLOpsの実践上の問題と解決 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.