Capítulo 10. Tuberías y MLOps

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En capítulos anteriores, demostramos cómo realizar cada paso individual de una canalización típica de ML, incluida la ingestión de datos, el análisis y la ingeniería de características, así como el entrenamiento, el ajuste y la implementación de modelos.

En este capítulo, lo unimos todo en canalizaciones repetibles y automatizadas mediante una solución completa de operaciones de aprendizaje automático (MLOps) con SageMaker Pipelines. También hablamos de varias opciones de orquestación de canalizaciones, como AWS Step Functions, Kubeflow Pipelines, Apache Airflow, MLFlow y TensorFlow Extended (TFX).

A continuación, profundizaremos en la automatización de nuestros Pipelines SageMaker cuando se confirma nuevo código, cuando llegan nuevos datos o en un horario fijo. Describiremos cómo volver a ejecutar una canalización cuando detectemos cambios estadísticos en nuestro modelo implementado, como una desviación de los datos o un sesgo del modelo. También discutiremos el concepto de flujos de trabajo humanos en el bucle, que pueden ayudar a mejorar la precisión de nuestro modelo.

Operaciones de aprendizaje automático

El ciclo de vida completo de desarrollo de modelos de suele requerir una estrecha colaboración entre los equipos de aplicaciones, ciencia de datos y DevOps para producir con éxito nuestros modelos, como se muestra en la Figura ...

Get Ciencia de datos en AWS now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.