Capítulo 6. Otros problemas de visión por ordenador

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el capítulo anterior, aprendiste algunas técnicas prácticas importantes para entrenar modelos en la práctica. Consideraciones como la selección de los ritmos de aprendizaje y el número de épocas son muy importantes para obtener buenos resultados.

En este capítulo vamos a estudiar otros dos tipos de problemas de visión por ordenador: la clasificación multietiqueta y la regresión. El primero se produce cuando quieres predecir más de una etiqueta por imagen (o a veces ninguna), y el segundo cuando tus etiquetas son uno o varios números: una cantidad en lugar de una categoría.

En el proceso, estudiaremos más profundamente las activaciones de salida, los objetivos y las funciones de pérdida en los modelos de aprendizaje profundo.

Clasificación multietiqueta

La clasificación multietiqueta se refiere al problema de identificar lascategorías de objetos en imágenes que pueden no contener exactamente un tipo de objeto. Puede haber más de un tipo de objeto, o puede que no haya ningún objeto en las clases que buscas.

Por ejemplo, éste habría sido un gran enfoque para nuestro clasificador de osos. Un problema del clasificador de osos que pusimos en marcha enel Capítulo 2 era que si un usuario subía algo que no era ningún tipo de oso, el modelo seguiría diciendo que era un oso pardo, negro o de peluche: no tenía capacidad ...

Get Aprendizaje profundo para programadores con fastai y PyTorch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.