Rozdział 11. Analizy i uczenie maszynowe dla danych przesyłanych strumieniowo
W poprzednich rozdziałach zakładaliśmy, że wszystkie dane są dostępne w scentralizowanej statycznej lokalizacji, na przykład w jeziorze danych w S3. W praktyce dane są nieustannie przesyłane strumieniowo z wielu różnych źródeł z całego świata jednocześnie. Na potrzeby zapobiegania oszustwom i wykrywania anomalii, gdzie opóźnienia typowe dla przetwarzania wsadowego są nieakceptowalne, trzeba nieustannie kontynuować uczenie maszynowe na podstawie strumieni danych. Można też uruchomić ciągłą analizę strumieni danych w czasie rzeczywistym, aby zyskać przewagę konkurencyjną i skrócić czas do uzyskania wniosków biznesowych.
W tym rozdziale przechodzimy od treningowego zbioru ...
Get Inżynieria danych na platformie AWS now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.