Skip to Content
入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化
book

入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化

by Hannes Hapke, Catherine Nelson, 中山 光樹
September 2021
Intermediate to advanced
392 pages
6h 8m
Japanese
O'Reilly Japan, Inc.
Content preview from 入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化

1章イントロダクション

1章では、まず機械学習パイプラインとその構築に必要なステップを説明します。次に、機械学習モデルを実験環境からロバストな本番システムへ移行するために必要なことを説明します。最後に、本書全体で用いるサンプルプロジェクトを紹介します。このサンプルプロジェクトを用いて、機械学習パイプラインの原理を説明します。

1.1 機械学習パイプラインの必要性

機械学習パイプラインの主な利点として、モデルのライフサイクルステップを自動化する点が挙げられます。機械学習では、新しい学習データを準備したら、データの検証、前処理、モデルの学習、分析、デプロイなどのステップを含むワークフローを実行する必要があります。現状、多くのデータサイエンスチームは、これらのステップを手動で実行しています。手動による実行はコストがかさみ、エラーの原因になるのが欠点です。以降では、手動による実行と比べた機械学習パイプラインの利点について詳しく説明します。

現行モデルの保守ではなく、新規モデルの開発に集中
自動化された機械学習パイプラインは、データサイエンティストを現行モデルの保守から解放します。多くのデータサイエンティストは、現行モデルを最新状態で保つ仕事に時間を費やしています。なぜ時間がかかるかというと、学習データを前処理するのにスクリプトを手動で実行し、一度しか使わないデプロイ用スクリプトを書き、モデルを手動でチューニングしているからです。自動化されたパイプラインは、データサイエンティストを新規モデルの開発に集中させます。これこそまさに、やりがいのある仕事です。結果として、データサイエンティストの満足度が向上し、競争の厳しい雇用市場において、従業員の定着率が改善します。
バグの防止
自動化されたパイプラインはバグを防ぐことができます。以降の章で説明しますが、自動化されたパイプラインでは、前処理は開発したモデルに紐付けられ、モデルはバージョン管理されたデータに紐付けられます。つまり、最新バージョンのデータを用意すると、新しいモデルが生成されるのです。前処理を更新した場合、現在の学習データを無効にし、更新された前処理で新しいモデルを生成します。手動の機械学習ワークフローでは、モデルの学習後に前処理を変更したばかりに、バグを作り込むことがよく起きます。この場合、学習時の前処理とは異なる前処理をするモデルをデプロイしてしまいます。そうすると、デプロイしたモデルで推論自体はできてしまうため、バグがあることに気がつくのが難しくなります。自動化されたワークフローなら、この種のバグは防げます。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

機械学習システムデザイン ―実運用レベルのアプリケーションを実現する継続的反復プロセス

機械学習システムデザイン ―実運用レベルのアプリケーションを実現する継続的反復プロセス

Chip Huyen, 江川 崇, 平山 順一

Publisher Resources

ISBN: 9784873119519Other