Capítulo 12. Detección de objetos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el capítulo anterior de se presentaron dos algoritmos populares para detectar rostros en fotografías: Viola-Jones, que se basa en el aprendizaje automático, y las MTCNN, que se basan en el aprendizaje profundo. La detección de caras es un caso especial de la detección de objetos, en la que los ordenadores detectan e identifican objetos en imágenes. Identificar un objeto es un problema de clasificación de imágenes, algo en lo que destacan las CNN. Pero encontrar objetos que identificar plantea un reto diferente.

La detección de objetos es un reto porque no se supone que los objetos estén perfectamente recortados y alineados, como ocurre en las tareas de clasificación de imágenes. Tampoco se limitan a uno por imagen. La Figura 12-1 muestra lo que podría ver un coche autoconducido al escanear los fotogramas de vídeo de una cámara orientada hacia delante. Una CNN entrenada para realizar una clasificación de imágenes convencional utilizando imágenes de entrenamiento cuidadosamente preparadas no puede ayudar. Puede que sea capaz de clasificar la imagen como una calle de una ciudad, pero no puede determinar que la imagen contiene coches, personas y semáforos, y mucho menos precisar su ubicación.

La detección de objetos ha crecido en velocidad y precisión en los últimos años, y los métodos más avanzados se basan en el aprendizaje profundo. ...

Get Aprendizaje Automático Aplicado e IA para Ingenieros now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.