Kapitel 6. Erkennung von Anomalien

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Eine Anomalie ist etwas, das sich von anderen Mitgliedern der gleichen Gruppe unterscheidet. Bei Daten ist eine Anomalie ein Datensatz, eine Beobachtung oder ein Wert, der sich von den übrigen Datenpunkten in einer Weise unterscheidet, die Bedenken oder Verdacht erregt. Für Anomalien gibt es verschiedene Bezeichnungen, darunter Ausreißer, Neuheiten, Rauschen, Abweichungen und Ausnahmen, um nur einige zu nennen. Ich werde die Begriffe Anomalie und Ausreißer in diesem Kapitel synonym verwenden, und du wirst vielleicht auch die anderen Begriffe in Diskussionen zu diesem Thema sehen. Die Aufdeckung von Anomalien kann das Endziel einer Analyse oder ein Schritt innerhalb eines umfassenderen Analyseprojekts sein.

Anomalien haben in der Regel eine von zwei Quellen: reale Ereignisse, die extrem oder anderweitig ungewöhnlich sind, oder Fehler, die bei der Datenerfassung oder -verarbeitung auftreten. Während viele der Schritte zur Erkennung von Ausreißern unabhängig von der Quelle gleich sind, hängt es von der Ursache ab, wie wir mit einer bestimmten Anomalie umgehen. Daher ist es für den Analyseprozess wichtig, die Ursache zu verstehen und zwischen den beiden Arten von Ursachen zu unterscheiden.

Reale Ereignisse können aus verschiedenen Gründen zu Ausreißern führen. Anomale Daten können auf Betrug, Eindringen in das Netzwerk, ...

Get SQL für die Datenanalyse now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.