Skip to Content
入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化
book

入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化

by Hannes Hapke, Catherine Nelson, 中山 光樹
September 2021
Intermediate to advanced
392 pages
6h 8m
Japanese
O'Reilly Japan, Inc.
Content preview from 入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化

7章モデル分析と検証

これまでに、データに関する統計量の確認や正しい特徴への変換、モデルの学習をしてきました。いよいよモデルを本番環境にデプロイする時が来たのでしょうか。私見ですが、モデルをデプロイする前に、モデルの性能を詳細に分析し、本番環境へデプロイ済みのモデルより性能が改善されているか確認するステップが必要だと考えています。図7-1に、パイプラインにおけるこれらのステップの立ち位置を示します。

機械学習パイプラインにおけるモデル分析と検証

図7-1 機械学習パイプラインにおけるモデル分析と検証

モデルの学習中は、評価セットを使って性能を計測し、さまざまなハイパーパラメータを試して最高性能を引き出そうとします。ただ、学習中に使用する指標は1つだけのことが多く、正解率を使うのが常です。

機械学習パイプラインを構築する際には、複雑なビジネス上の質問に答えようとしたり、複雑な実世界のシステムをモデル化しようとしたりすることがよくあります。モデルがその質問に答えられるかどうかを判断するには、1つの指標だけでは十分でないことがよくあります。これは、データセットが不均衡であったり、モデルの予測による影響がグループ間で偏っている場合、とくに当てはまります。

加えて、指標1つで評価セット全体の平均的な性能を表すため、重要な詳細を覆い隠してしまうことがあります。たとえば、モデルが人々に関するデータを扱っている場合、次のようなことを気にしたほうがよいはずです。

  • モデルとやり取りするすべての人が同じ体験を得られるか
  • 男性ユーザーより女性ユーザーに対する性能のほうが良くないか ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

機械学習システムデザイン ―実運用レベルのアプリケーションを実現する継続的反復プロセス

機械学習システムデザイン ―実運用レベルのアプリケーションを実現する継続的反復プロセス

Chip Huyen, 江川 崇, 平山 順一

Publisher Resources

ISBN: 9784873119519Other