Capítulo 6. Entrenar modelos con Spark MLlib
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Ahora que has aprendido a gestionar experimentos de aprendizaje automático, a conocer los datos y la ingeniería de características, es hora de entrenar algunos modelos.
¿En qué consiste exactamente? Entrenar un modelo es el proceso de ajustar o cambiar los parámetros del modelo para que mejore su rendimiento. La idea aquí es alimentar tu modelo de aprendizaje automático con datos de entrenamiento que le enseñen a resolver una tarea específica: por ejemplo, clasificar un objeto de una foto como gato identificando sus propiedades de "gato".
En este capítulo, aprenderás cómo funcionan los algoritmos de aprendizaje automático, cuándo utilizar cada herramienta, cómo validar tu modelo y, lo más importante, cómo automatizar el proceso con la API Spark MLlib Pipelines.
A alto nivel, este capítulo cubre lo siguiente:
-
Algoritmos básicos de aprendizaje automático de Spark
-
Aprendizaje automático supervisado con Spark machine learning
-
Aprendizaje automático no supervisado con Spark machine learning
-
Evaluar tu modelo y ponerlo a prueba
-
Hiperparámetros y ajuste de tu modelo
-
Uso de pipelines de aprendizaje automático Spark
-
Persistencia de modelos y canalizaciones en disco
Algoritmos
Empecemos por los algoritmos, la parte esencial de tus actividades de entrenamiento de modelos. La entrada de un algoritmo de aprendizaje ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access