Skip to Content
Guida allo studio per diventare Associate Certified Data Engineer di Databricks
book

Guida allo studio per diventare Associate Certified Data Engineer di Databricks

by Derar Alhussein
March 2025
Intermediate to advanced
408 pages
10h 42m
Italian
O'Reilly Media, Inc.
Content preview from Guida allo studio per diventare Associate Certified Data Engineer di Databricks

Capitolo 5. Elaborazione dei dati incrementali

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

Nei capitoli precedenti abbiamo esplorato i fondamenti dell'elaborazione dei dati in gruppi o in batch. Tuttavia, quando i dati vengono generati in modo continuo, gli approcci tradizionali all'elaborazione in batch tendono a diventare insufficienti. In questo capitolo esploreremo i concetti e le tecniche di elaborazione dei dati in streaming, tra cui lo Structured Streaming di Spark e l'ingestione incrementale di dati da file. Inoltre, discuteremo il concetto di architettura a medaglione e come costruirla secondo il modello di elaborazione dei flussi.

Streaming di dati con Apache Spark

Apache Spark offre un solido supporto per l'elaborazione di dati in streaming, consentendoti di eseguire in modo efficiente analisi in tempo reale. Al centro di questo processo c'è il concetto di flusso di dati, che è il fulcro dell'elaborazione. Per lavorare efficacemente con i dati in streaming in Spark, cerchiamo prima di tutto di capire cos'è un flusso di dati e le sue caratteristiche.

Cos'è un flusso di dati?

Un flusso di dati rappresenta un flusso illimitato di dati, spesso provenienti da varie fonti come sensori, file di log o piattaforme di social media. Quando vengono generati nuovi dati, questi vengono aggiunti al flusso, rendendolo un insieme di dati dinamico e in continua evoluzione. Esempi di flussi ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

API pratiche per l'IA e la scienza dei dati

API pratiche per l'IA e la scienza dei dati

Ryan Day

Publisher Resources

ISBN: 9798341639430Supplemental Content