Capítulo 4. Aprendizaje por transferencia y otros trucos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Después de haber examinado las arquitecturas en el capítulo anterior, quizá te preguntes si puedes descargar un modelo ya entrenado y entrenarlo aún más. Y la respuesta es ¡sí! Se trata de una técnica increíblemente potente en los círculos del aprendizaje profundo denominada aprendizaje por transferencia, mediante la cual una red entrenada para una tarea (por ejemplo, ImageNet) se adapta a otra (peces frente a gatos).
¿Por qué harías esto? Resulta que una arquitectura entrenada en ImageNet ya sabe muchísimo sobre imágenes y, en particular, bastante sobre si algo es un gato o un pez (o un perro o una ballena). Como ya no partes de una red neuronal esencialmente en blanco, con el aprendizaje por transferencia es probable que emplees mucho menos tiempo en el entrenamiento, y puedes salirte con la tuya con un conjunto de datos de entrenamiento mucho más pequeño. Los métodos tradicionales de aprendizaje profundo requieren enormes cantidades de datos para generar buenos resultados. Con el aprendizaje por transferencia, puedes crear clasificadores de nivel humano con unos cientos de imágenes.
Aprendizaje por transferencia con ResNet
Ahora, lo obvio es crear un modelo ResNet como hicimos en el Capítulo 3 e introducirlo en nuestro bucle de entrenamiento existente. ¡Y puedes hacerlo! No hay nada mágico en el modelo ...