Capítulo 3. Un recorrido por el conjunto de herramientas de Spark
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 2, hemos introducido en los conceptos básicos de Spark, como las transformaciones y las acciones, en el contexto de las API estructuradas de Spark. Estos sencillos bloques de construcción conceptual son la base del vasto ecosistema de herramientas y bibliotecas de Apache Spark(Figura 3-1). Spark se compone de estas primitivas -las API de bajo nivel y las API Estructuradas- y de una serie de bibliotecas estándar para funciones adicionales.
Las bibliotecas de Spark soportan una gran variedad de tareas diferentes, desde el análisis de gráficos y el aprendizaje automático hasta el streaming y las integraciones con una gran cantidad de sistemas informáticos y de almacenamiento. Este capítulo presenta un recorrido relámpago por gran parte de lo que ofrece Spark, incluidas algunas de las API que aún no hemos cubierto y algunas de las principales bibliotecas. Para cada sección, encontrarás información más detallada en otras partes de este libro; nuestro propósito aquí es proporcionarte una visión general de lo que es posible.
Este capítulo abarca lo siguiente:
-
Ejecutar aplicaciones de producción con
spark-submit
-
Conjuntos de datos: API seguras ...
Get Spark: La Guía Definitiva now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.