KAPITEL 9

Unausgeglichene Klassen

Wenn beim Klassifizieren von Daten die Klassen nicht relativ ausgeglichen besetzt sind, kann das Modell eine Tendenz zu den häufigeren Klassen entwickeln. Haben Sie beispielsweise einen positiven und 99 negative Fälle, können Sie eine Vertrauenswahrscheinlichkeit von 99% einfach dadurch erreichen, dass Sie alles als negativ klassifizieren. Es gibt mehrere Möglichkeiten, mit unausgeglichenen Klassen umzugehen.

Eine andere Metrik anwenden

Ein Vorschlag wäre, anstelle der Vertrauenswahrscheinlichkeit ein anderes Maß zum Einstellen der Modelle zu nutzen (die Fläche unter der Kurve, AUC, ist eine gute Wahl). Auch Genauigkeit und Trefferquote sind eine bessere Wahl, wenn sich die Größen der Zielklassen unterscheiden. ...

Get Machine Learning – Die Referenz now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.