Overview
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los sistemas modernos contienen CPU multinúcleo y GPU que tienen potencial para la computación paralela. Pero muchas herramientas científicas de Python no se diseñaron para aprovechar este paralelismo. Con este breve pero exhaustivo recurso, los científicos de datos y los programadores de Python aprenderán cómo la biblioteca de código abierto Dask para la computación paralela proporciona API que facilitan la paralelización de las bibliotecas PyData, incluidas NumPy, pandas y scikit-learn.
Los autores Holden Karau y Mika Kimmins te muestran cómo utilizar los cálculos de Dask en sistemas locales y luego escalarlos a la nube para cargas de trabajo más pesadas. Este práctico libro explica por qué Dask es popular entre expertos de la industria y académicos, y lo utilizan organizaciones como Walmart, Capital One, la Facultad de Medicina de Harvard y la NASA.
Con este libro aprenderás
- Qué es Dask, dónde puedes utilizarlo y cómo se compara con otras herramientas
- Cómo utilizar Dask para el procesamiento paralelo de datos por lotes
- Conceptos clave de sistemas distribuidos para trabajar con Dask
- Métodos para utilizar Dask con APIs de alto nivel y bloques de construcción
- Cómo trabajar con bibliotecas integradas como scikit-learn, pandas y PyTorch
- Cómo utilizar Dask con GPUs
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access