Skip to Content
Ciencia de datos en AWS
book

Ciencia de datos en AWS

by Chris Fregly, Antje Barth
October 2024
Intermediate to advanced
524 pages
15h 11m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Ciencia de datos en AWS

Capítulo 5. Explorar el conjunto de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el capítulo anterior, demostramos cómo ingerir datos en la nube con Amazon Athena y Redshift. Amazon Athena ofrece consultas SQL ad hoc y sin servidor para datos en S3 sin necesidad de configurar, escalar ni administrar ningún clúster. Amazon Redshift proporciona el rendimiento de consulta más rápido para las cargas de trabajo de informes empresariales e inteligencia de negocios, en particular las que implican SQL complejo con múltiples uniones y subconsultas a través de muchas fuentes de datos, incluyendo bases de datos relacionales y archivos planos. Creamos un mapeo de datos-catálogo para nuestro lago de datos basado en S3 utilizando AWS Glue Catalog. Ejecutamos consultas ad hoc en nuestro lago de datos con Athena. Y ejecutamos consultas en nuestro almacén de datos con Amazon Redshift.

También echamos un primer vistazo a nuestro conjunto de datos. Según hemos sabido, el conjunto de datos de opiniones de clientes de Amazon consta de más de 150 millones de opiniones de clientes sobre productos de 43 categorías de productos diferentes en el sitio web Amazon.com desde 1995 hasta 2015. El conjunto de datos contiene el texto real de las reseñas de los clientes junto con metadatos adicionales. Se presenta en dos formatos valores separados por tabuladores (TSV) basados en filas y Apache Parquet basado en columnas.

En este ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Migrar a AWS: Guía del administrador

Migrar a AWS: Guía del administrador

Jeff Armstrong
Las mejores prácticas de Kubernetes, 2ª edición

Las mejores prácticas de Kubernetes, 2ª edición

Brendan Burns, Eddie Villalba, Dave Strebel, Lachlan Evenson

Publisher Resources

ISBN: 9798341600638Supplemental Content