Capítulo 11. Gestión delciclo de vida del aprendizaje automáticocon MLflow

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

A medida que el aprendizaje automático gana protagonismo en los sectores y se implementa en entornos de producción, el nivel de colaboración y complejidad que lo rodea también ha aumentado. Afortunadamente, han surgido plataformas y herramientas que ayudan a gestionar el ciclo de vida del aprendizaje automático de forma estructurada. Una de estas plataformas que funciona bien con PySpark es MLflow. En este capítulo, mostraremos cómo se puede utilizar MLflow con PySpark. Por el camino, introduciremos prácticas clave que puedes incorporar en tu flujo de trabajo de ciencia de datos.

En lugar de empezar de cero, nos basaremos en el trabajo que hicimos en el Capítulo 4. Revisaremos nuestra implementación del árbol de decisión utilizando el conjunto de datos Covtype. Sólo que esta vez utilizaremos MLflow para gestionar el ciclo de vida del aprendizaje automático.

Empezaremos explicando los retos y procesos que engloban el ciclo de vida del aprendizaje automático. A continuación, presentaremos MLflow y sus componentes, así como la compatibilidad de MLflow con PySpark. A esto le seguirá una introducción al seguimiento de las ejecuciones de entrenamiento de aprendizaje automático mediante MLflow. A continuación, aprenderemos a gestionar modelos de aprendizaje automático mediante MLflow Models. A continuación, ...

Get Analítica avanzada con PySpark now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.