Skip to Main Content
Descifrar las arquitecturas de datos
book

Descifrar las arquitecturas de datos

by James Serra
September 2024
Intermediate to advanced content levelIntermediate to advanced
278 pages
8h 31m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Descifrar las arquitecturas de datos

Capítulo 5. El lago de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Los big data empezaron a aparecer en volúmenes sin precedentes a principios de la década de 2010, debido al aumento de las fuentes que generan datos semiestructurados y no estructurados, como sensores, vídeos y redes sociales. Los datos semiestructurados y no estructurados contienen una cantidad fenomenal de valor: ¡piensa en la información contenida en los correos electrónicos de los clientes durante años! Sin embargo, los almacenes de datos relacionales de entonces sólo podían manejar datos estructurados. También tenían problemas para manejar grandes cantidades de datos o datos que debían ser ingestados con frecuencia, por lo que no eran una opción para almacenar este tipo de datos. Esto obligó a la industria a idear una solución: los lagos de datos. Los lagos de datos pueden manejar fácilmente datos semiestructurados y no estructurados y gestionar datos que se ingieren con frecuencia.

Hace años, hablé con analistas de una gran cadena minorista que querían ingerir datos de Twitter para saber qué pensaban los clientes de sus tiendas. Sabían que los clientes dudarían en plantear sus quejas a los empleados de la tienda, pero se apresurarían a ponerlas en Twitter. Les ayudé a introducir los datos de Twitter en un lago de datos y a evaluar el sentimiento de los comentarios de los clientes, clasificándolos como positivos, neutros o negativos. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Fundamentos de la Ingeniería de Datos

Fundamentos de la Ingeniería de Datos

Joe Reis, Matt Housley
Arquitectura de plataformas de datos modernas

Arquitectura de plataformas de datos modernas

Jan Kunigk, Ian Buss, Paul Wilkinson, Lars George
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner

Publisher Resources

ISBN: 9781098181437