Skip to main content

Get full access to 仕事ではじめる機械学習 第2版 and 60K+ other titles, with a free 10-day trial of O'Reilly.

There are also live events, courses curated by job role, and more.

6章継続的トレーニングをするための機械学習基盤

4章では、機械学習をシステムに組み込む方法についての基本的な設計方針を学びました。本章では、さらに長期的にシステムを運用するためにはどのようなポイントを抑えて機械学習基盤を構築していけば良いのかを説明します。

6.1 機械学習システム特有の難しさ

1.3実システムにおける機械学習の問題点への対処方法」でも実システムにおける機械学習の問題点を書きましたが、大きな機械学習システムには、従来のソフトウェアシステムではあまり問題視されることがなかった課題があります。ここでは、従来のソフトウェアシステムと比較をした機械学習システムの課題を明らかにしきましょう。具体的には、次の3つが大きな機械学習システム特有の課題だといえます。

  1. データサイエンティスト vs ソフトウェアエンジニア

  2. 同一の予測結果を得る難しさ

  3. 継続的トレーニングとサービングの必要性

6.1.1 データサイエンティスト vs ソフトウェアエンジニア

図6.1に、機械学習の予測モデル開発の典型的なワークフローの例を示します。

_images/ml_pipeline.png

図6.1 予測モデル開発の典型的なワークフロー

図6.1の流れを要約すると、まずデータ基盤へのデータ収集があり、必要なデータの加工や可視化などの探索的データ分析(EDA、Exploratory Data Analysis)を実施し、学習したモデルまたは予測結果を本番環境へとデプロイしています。

このワークフローにおいて、いわゆるデータサイエンティストや機械学習エンジニアと呼ばれる人々は、真ん中の探索的なモデル開発の部分を担当することになります。一方、最初および最後の部分の開発や運用を担当することになるのは、ソフトウェアエンジニアやデータエンジニアと呼ばれる人々です。つまり、この図に代表される機械学習のワークフローには、複数のロールにまたがってシステム開発を進めることが多いという特徴があります。 ...

Get 仕事ではじめる機械学習 第2版 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Don’t leave empty-handed

Get Mark Richards’s Software Architecture Patterns ebook to better understand how to design components—and how they should interact.

It’s yours, free.

Get it now
Cover of Software Architecture Patterns

Check it out now on O’Reilly

Dive in for free with a 10-day trial of the O’Reilly learning platform—then explore all the other resources our members count on to build skills and solve problems every day.

Start your free trial Become a member now