Prefacio
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Escribimos este libro para científicos de datos e ingenieros de datos familiarizados con Python y pandas que buscan manejar problemas a mayor escala de lo que les permiten sus herramientas actuales. Los usuarios actuales de PySpark descubrirán que parte de este material se solapa con sus conocimientos actuales de PySpark, pero esperamos que les siga resultando útil, y no sólo para alejarse de la Máquina Virtual Java (JVM).
Si no estás familiarizado con Python, algunos títulos excelentes de O'Reilly son Learning Python y Python for Data Analysis. Si tú y tu equipo sois usuarios más frecuentes de lenguajes JVM (como Java o Scala), aunque somos un poco parciales, te animamos a que eches un vistazo a Apache Spark junto con Learning Spark (O'Reilly) y High Performance Spark (O'Reilly).
Este libro se centra principalmente en la ciencia de datos y tareas relacionadas porque, en nuestra opinión, es ahí donde Dask destaca más. Si tienes un problema más general para el que Dask no parece encajar del todo, te animamos (de nuevo con un poco de parcialidad) a que le eches un vistazo a Scaling Python with Ray (O'Reilly), que se centra menos en la ciencia de datos.
Una nota sobre la responsabilidad
Como dice el refrán, un gran poder conlleva una gran responsabilidad. Dask y herramientas similares te permiten procesar más datos y construir modelos más complejos. Es esencial ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access