Capítulo 3. Un recorrido por el conjunto de herramientas de Spark

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 2, hemos introducido en los conceptos básicos de Spark, como las transformaciones y las acciones, en el contexto de las API estructuradas de Spark. Estos sencillos bloques de construcción conceptual son la base del vasto ecosistema de herramientas y bibliotecas de Apache Spark(Figura 3-1). Spark se compone de estas primitivas -las API de bajo nivel y las API Estructuradas- y de una serie de bibliotecas estándar para funciones adicionales.

image
Figura 3-1. Conjunto de herramientas de Spark

Las bibliotecas de Spark soportan una gran variedad de tareas diferentes, desde el análisis de gráficos y el aprendizaje automático hasta el streaming y las integraciones con una gran cantidad de sistemas informáticos y de almacenamiento. Este capítulo presenta un recorrido relámpago por gran parte de lo que ofrece Spark, incluidas algunas de las API que aún no hemos cubierto y algunas de las principales bibliotecas. Para cada sección, encontrarás información más detallada en otras partes de este libro; nuestro propósito aquí es proporcionarte una visión general de lo que es posible.

Este capítulo abarca lo siguiente:

  • Ejecutar aplicaciones de producción con spark-submit

  • Conjuntos de datos: API seguras ...

Get Spark: La Guía Definitiva now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.