book

Modelli di progettazione dell'ingegneria dei dati

by Bartosz Konieczny

April 2025

Intermediate to advanced

374 pages

11h 12m

Italian

O'Reilly Media, Inc.

Read now

Unlock full access

Convenzioni utilizzate in questo libroLa struttura di questo libroCome utilizzare questo libroCosa devo sapere prima di leggere questo libro?Glossario ed esempi di codiceFormazione online O'ReillyCome contattarciRingraziamenti
Cosa sono i Design Pattern?Ancora modelli di design?Modelli comuni di ingegneria dei datiCaso di studio utilizzato in questo libroRiassunto
Carico completoModello: Caricatore completoCarico incrementaleModello: Caricatore incrementaleSchema: Modifica della cattura dei datiReplicaModello: Replicatore passanteModello: Replicatore di trasformazioneCompattazione dei datiModello: CompattatoreProntezza dei datiModello: Marcatore di prontezzaGuidato dagli eventiSchema: Trigger esternoSommario
Registri non processabiliModello: Lettera mortaRegistri duplicatiSchema: Deduplicatore a finestraDati in ritardoSchema: Rilevatore di dati in ritardoSchema: Integratore statico di dati in ritardoModello: Integratore dinamico di dati tardiviFiltraggioModello: Filtro intercettatoreTolleranza ai guastiModello: CheckpointerRiassunto
SovrascritturaSchema: Pulitore veloce di metadatiSchema: Sovrascrittura dei datiAggiornamentiSchema: FusioneSchema: Fusione staticaDatabaseSchema: Idempotenza con chiaveModello: Scrittore transazionaleSet di dati immutabiliSchema: ProxyRiassunto
Arricchimento dei datiModello: Giuntura staticaModello: Giuntura dinamicaDecorazione dei datiModello: AvvolgitoreSchema: Decoratore di metadatiAggregazione dei datiSchema: Aggregatore distribuitoModello: Aggregatore localeSessionizzazioneSchema: Sessionizzatore incrementaleSchema: Sessionizzatore staticoOrdinazione dei datiModello: Ordinatore di pacchetti di cestiniModello: Ordinatore FIFORiassunto
SequenzaSchema: Sequencer localeSchema: Sequencer isolatoFan-InModello: Allineato Fan-InSchema: Fan-In non allineatoUscita a ventaglioModello: Spaccatura parallelaModello: Scelta esclusivaOrchestrazioneModello: Runner singoloSchema: Corridore concorrenteRiassunto
Rimozione dei datiModello: Partizione verticaleSchema: Sovrascrittura in locoControllo degli accessiPattern: Accessore a grana fine per le tabellePattern: Accessore a grana fine per le risorseProtezione dei datiSchema: CrittografoSchema: AnonimizzatoreSchema: Pseudo-anonimizzatoreConnettivitàModello: Puntatore di segretiModello: Connettore senza segretiRiassunto
SuddivisioneModello: Partizione orizzontaleModello: Partizione verticaleOrganizzazione dei recordModello: SecchielloModello: SorterOttimizzazione delle prestazioni di letturaModello: Miglioratore di metadatiPattern: Materializzatore di set di datiModello: ManifestoRappresentazione dei datiSchema: NormalizzatoreSchema: DenormalizzatoreRiassunto
Applicazione della qualitàSchema: Audit-Scrittura-Audit-PubblicazioneModello: Esecutore di vincoliCoerenza dello schemaSchema: Schema Compatibility EnforcerSchema: Migratore di schemiOsservazione della qualitàSchema: Osservatore offlineModello: Osservatore onlineSommario

Rilevatori di datiModello: Rilevatore di interruzione del flussoModello: Rilevatore di obliquitàRilevatori di tempoSchema: Rivelatore di lagSchema: Rilevatore di mancanze SLALignaggio dei datiSchema: Tracciamento del set di datiSchema: Tracker a grana fineRiassunto
Modelli di progettazione per l'ingestione dei datiModelli di progettazione per la gestione degli erroriModelli di progettazione dell'idempotenzaModelli di progettazione del valore dei datiModelli di progettazione del flusso di datiModelli di progettazione della sicurezza dei datiModelli di progettazione per l'archiviazione dei datiModelli di progettazione della qualità dei datiModelli di progettazione dell'osservabilità dei dati

Content preview from Modelli di progettazione dell'ingegneria dei dati

Capitolo 2. Modelli di progettazione per l'ingestione dei dati

Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com

I sistemi di ingegneria dati sono raramente dei generatori di dati. Più spesso, la loro prima fase è l'acquisizione di dati da vari produttori di dati. Lavorare con questi produttori non è facile: possono essere pipeline diverse all'interno del tuo team, team diversi all'interno della tua azienda o addirittura organizzazioni completamente diverse. Poiché ogni produttore ha vincoli specifici ereditati da ambienti tecnici e aziendali, interagire con loro può essere una sfida per te.

Ma non hai scelta. Devi adattarti. Altrimenti non otterrai alcun dato e, di conseguenza, non potrai alimentare i tuoi carichi di lavoro di data analytics o data science. O peggio ancora, otterrai dei dati, li condividerai con i tuoi utenti a valle e qualche giorno dopo riceverai delle lamentele. Potrebbero riguardare un set di dati incompleto, un'organizzazione dei dati inefficiente o dati completamente danneggiati che richiedono processi interni di ripristino e backfilling.

Come puoi vedere, l'inserimento dei dati nel tuo sistema è un compito fondamentale per migliorare la tua vita e quella dei tuoi utenti. Per questo motivo, questo libro deve iniziare con i modelli di progettazione dell'ingestione dei dati.

I modelli presentati in questo capitolo affrontano gli scenari e le sfide che potresti incontrare ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341640955Supplemental Content

Modelli di progettazione dell'ingegneria dei dati

by Bartosz Konieczny

Capitolo 2. Modelli di progettazione per l'ingestione dei dati

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Fondamenti di ingegneria dei dati

Facilitare l'architettura del software

Guida tascabile a Linux, 4a edizione

Fundamentals of Software Architecture, 2a edizione

Publisher Resources

Capitolo 2. Modelli di progettazione per l'ingestione dei dati

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Fondamenti di ingegneria dei dati

Facilitare l'architettura del software

Guida tascabile a Linux, 4a edizione

Fundamentals of Software Architecture, 2a edizione

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.