Skip to Main Content
Diseño de aplicaciones intensivas en datos
book

Diseño de aplicaciones intensivas en datos

by Martin Kleppmann
August 2024
Intermediate to advanced content levelIntermediate to advanced
616 pages
22h 8m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Diseño de aplicaciones intensivas en datos

Capítulo 11. Procesamiento de flujos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Un sistema complejo que funciona resulta invariablemente haber evolucionado a partir de un sistema simple que funciona. La proposición inversa también parece ser cierta: Un sistema complejo diseñado desde cero nunca funciona y no se puede hacer que funcione.

John Gall, Sistemática (1975)

En el Capítulo 10 hablamos del procesamiento por lotes: técnicas que leen un conjunto de archivos como entrada y producen un nuevo conjunto de archivos de salida. La salida es una forma de datos derivados; es decir, un conjunto de datos que puede volver a crearse ejecutando de nuevo el proceso por lotes si es necesario. Hemos visto cómo esta idea sencilla pero poderosa puede utilizarse para crear índices de búsqueda, sistemas de recomendación, análisis y mucho más.

Sin embargo, a lo largo del Capítulo 10 se ha mantenido un gran supuesto: que la entrada esté acotada -es decir, que tenga un tamaño conocido y finito- para que el proceso por lotes sepa cuándo ha terminado de leer su entrada. Por ejemplo, la operación de ordenación que es fundamental en MapReduce debe leer toda su entrada antes de poder empezar a producir la salida: puede ocurrir que el último registro de entrada sea el que tenga la clave más baja y, por tanto, tenga que ser ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Construyendo Microservicios, 2ª Edición

Construyendo Microservicios, 2ª Edición

Sam Newman
Construyendo Arquitecturas Evolutivas, 2ª Edición

Construyendo Arquitecturas Evolutivas, 2ª Edición

Neal Ford, Rebecca Parsons, Patrick Kua, Pramod Sadalage
Métricas de arquitectura de software

Métricas de arquitectura de software

Christian Ciceri, Dave Farley, Neal Ford, Andrew Harmel-Law, Michael Keeling, Carola Lilienthal, João Rosa, Alexander von Zitzewitz, Rene Weiss, Eoin Woods

Publisher Resources

ISBN: 9781098180034Supplemental Content