Skip to main content

Get full access to 仕事ではじめる機械学習 第2版 and 60K+ other titles, with a free 10-day trial of O'Reilly.

There are also live events, courses curated by job role, and more.

3章学習結果を評価するには

システムに機械学習を組み込んだときに、最初から満足できる結果が得られることはまれです。では、満足できる結果かどうかはどのように測るのでしょうか? 本章では、機械学習の結果を評価する方法について解説します。

3.1 分類の評価

本節では、スパム分類の例を考えながら以下の4つの指標について紹介します。

  • 正解率(Accuracy)

  • 適合率(Precision)

  • 再現率(Recall)

  • F値(F-measure)

また、これらを考えていく上で重要な以下の概念についても説明します。

  • 混同行列(Confusion Matrix)

  • マイクロ平均(Micro-average)、マクロ平均(Macro-average)

3.1.1 正解率を使えば良いのか?

分類のタスクでは、正しく分類されたか否かで分類器の性能を見極めます。まずは一番シンプルな正解率(Accuracy)について考えてみましょう。

正解率は

正解率 = \frac{正解した数}{予測した全データ数}

として求めます。

例として迷惑メール(スパム)と普通のメール(非スパム)を分類する、メールのスパム分類について考えます。2値分類の例ですね。

届いたメール100件を人の手で確認した所、スパムの数が60件で普通のメールが40件でした。もし、すべてをスパムとする分類器があったとすると、正解率は60%です。

分類問題の場合、一般的にはランダムで出力した結果が性能の最低水準となります。2値分類の場合は2クラスがランダムに出力されるので正解率は50%に、3値分類の場合は3クラスがランダムに出力されるため平均的に正解すると正解率は33.3%になります ...

Get 仕事ではじめる機械学習 第2版 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.

Don’t leave empty-handed

Get Mark Richards’s Software Architecture Patterns ebook to better understand how to design components—and how they should interact.

It’s yours, free.

Get it now
Cover of Software Architecture Patterns

Check it out now on O’Reilly

Dive in for free with a 10-day trial of the O’Reilly learning platform—then explore all the other resources our members count on to build skills and solve problems every day.

Start your free trial Become a member now