Prefacio
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Te damos la bienvenida a la segunda edición de Aprendiendo Spark. Han pasado cinco años desde que se publicó la primera edición en 2015, originalmente escrita por Holden Karau, Andy Konwinski, Patrick Wendell y Matei Zaharia. Esta nueva edición se ha actualizado para reflejar la evolución de Apache Spark a través de Spark 2.x y Spark 3.0, incluido su ecosistema ampliado de fuentes de datos incorporadas y externas, aprendizaje automático y tecnologías de streaming con las que Spark está estrechamente integrado.
A lo largo de los años, desde su primera versión 1.x, Spark se ha convertido en el motor de procesamiento unificado de big data de facto. Por el camino, ha ampliado su alcance para incluir soporte para diversas cargas de trabajo analíticas. Nuestra intención es captar y conservar esta evolución para los lectores, mostrando no sólo cómo puedes utilizar Spark, sino cómo encaja en la nueva era de los grandes datos y el aprendizaje automático. De ahí que hayamos diseñado cada capítulo de forma que se construya progresivamente sobre las bases sentadas por los capítulos anteriores, asegurándonos de que el contenido es adecuado para el público al que va dirigido.
A quién va dirigido este libro
La mayoría de los desarrolladores que trabajan con big data son ingenieros de datos, científicos de datos o ingenieros de aprendizaje automático. Este libro está ...