Overview
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Aprende a construir soluciones de aprendizaje automático escalables de extremo a extremo con Apache Spark. Con esta guía práctica, el autor Adi Polak presenta a los profesionales de datos y ML soluciones creativas que superan los métodos tradicionales actuales. Aprenderás un enfoque más holístico que te lleva más allá de los requisitos específicos y los objetivos organizativos, permitiendo a los profesionales de datos y ML colaborar y entenderse mejor.
Scaling Machine Learning with Spark examina varias tecnologías para construir flujos de trabajo ML distribuidos de extremo a extremo basados en el ecosistema Apache Spark con Spark MLlib, MLflow, TensorFlow y PyTorch. Si eres un científico de datos que trabaja con aprendizaje automático, este libro te muestra cuándo y por qué utilizar cada tecnología.
Aprenderás:
- Explorar el aprendizaje automático, incluidos los conceptos y la terminología de la informática distribuida
- Gestionar el ciclo de vida del ML con MLflow
- Ingesta de datos y preprocesamiento básico con Spark
- Explorar la ingeniería de características y utilizar Spark para extraerlas
- Entrena un modelo con MLlib y construye una canalización para reproducirlo
- Construye un sistema de datos para combinar la potencia de Spark con el aprendizaje profundo
- Obtén un ejemplo paso a paso de cómo trabajar con TensorFlow distribuido
- Utiliza PyTorch para escalar el aprendizaje automático y su arquitectura interna
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access