KAPITEL 11

Streaming-Analysen und Machine Learning

In den vorangegangenen Kapiteln sind wir davon ausgegangen, dass alle unsere Daten an einem zentralen, statischen Ort verfügbar sind, beispielsweise in unserem S3-basierten Data Lake. In der realen Welt strömen die Daten kontinuierlich und gleichzeitig aus vielen verschiedenen Quellen auf der ganzen Welt. Für Anwendungsfälle wie Betrugsprävention (engl. Fraud Prevention) oder die Erkennung von Anomalien (engl. Anomaly Detection), bei denen eine Verzögerung, die zwangsläufig im Rahmen der Verarbeitung von Batches entsteht, nicht akzeptabel ist, müssen wir Machine Learning auf Datenströmen anwenden. Gegebenenfalls möchten wir auch kontinuierliche Analysen anhand von Echtzeitdatenströmen durchführen, ...

Get Data Science mit AWS now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.