KAPITEL 5

Klassifikation

Data Scientists sind oftmals mit der Aufgabe konfrontiert, Entscheidungen für gewisse Geschäftsprozesse zu automatisieren. Ist eine E-Mail ein Phishing-Versuch? Ist es wahrscheinlich, dass sich ein Kunde abwendet? Ist es wahrscheinlich, dass der Webnutzer auf eine Werbung klickt? All dies sind Klassifikationsaufgaben, die eine Form des überwachten Lernens darstellen, bei der wir zunächst ein Modell auf Daten trainieren, deren Ergebnis uns bekannt ist, und das Modell dann auf Daten anwenden, deren Ergebnis nicht bekannt ist. Die Klassifikation ist vielleicht der wichtigste Ansatz zur Vorhersage: Ziel ist es, vorherzusagen, ob eine Beobachtung einem Erfolg (1) oder einem Misserfolg (0) entspricht (Phishing/kein Phishing, ...

Get Praktische Statistik für Data Scientists, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.