Prólogo
Apache Spark ha evolucionado significativamente desde que inicié el proyecto en la UC Berkeley en 2009. Tras su traslado a la Apache Software Foundation, el proyecto de código abierto ha contado con más de 1.400 colaboradores de cientos de empresas, y el grupo mundial de reuniones de Spark ha crecido hasta superar el medio millón de miembros. La base de usuarios de Spark también se ha diversificado mucho, abarcando desarrolladores de Python, R, SQL y JVM, con casos de uso que van desde la ciencia de datos a la inteligencia empresarial y la ingeniería de datos. He estado trabajando estrechamente con la comunidad Apache Spark para ayudar a continuar su desarrollo, y estoy encantado de ver los progresos realizados hasta ahora.
El lanzamiento de Spark 3.0 marca un hito importante para el proyecto y ha despertado la necesidad de actualizar el material de aprendizaje. La idea de una segunda edición de Aprender Spark ha surgido muchas veces, y ya era hora. Aunque fui coautor de Learning Spark y Spark: La Guía Definitiva (ambos de O'Reilly), ya era hora de que dejara que la siguiente generación de colaboradores de Spark retomara la narrativa. Estoy encantado de que cuatro experimentados profesionales y desarrolladores, que han estado trabajando estrechamente con Apache Spark desde sus primeros días, se hayan unido para escribir esta segunda edición del libro, incorporando las API más recientes y las buenas prácticas para los desarrolladores de Spark en una guía clara e informativa. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access