Capítulo 9. Detección de Personas: Creación de una aplicación

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Si preguntaras a la gente cuál de sus sentidos tiene mayor impacto en su vida cotidiana, muchos responderían que la vista.1

La visión es un sentido profundamente útil. Permite a innumerables organismos naturales navegar por su entorno, encontrar fuentes de alimento y evitar correr peligro. Como humanos, la visión nos ayuda a reconocer a nuestros amigos, interpretar la información simbólica y comprender el mundo que nos rodea, sin tener que acercarnos demasiado.

Hasta hace muy poco, las máquinas no disponían del poder de la visión. La mayoría de nuestros robots se limitaban a husmear por el mundo con sensores táctiles y de proximidad, espigando el conocimiento de su estructura a partir de una serie de colisiones. De un vistazo, una persona puede describirte la forma, las propiedades y la finalidad de un objeto, sin tener que interactuar con él en absoluto. Un robot no tendría esa suerte. La información visual era demasiado desordenada, desestructurada y difícil de interpretar.

Con la evolución de las redes neuronales convolucionales, se ha hecho fácil construir programas que pueden ver. Inspiradas en la estructura de la corteza visual de los mamíferos, las CNN aprenden a dar sentido a nuestro mundo visual, filtrando una entrada abrumadoramente compleja en un mapa de patrones y formas conocidos. La combinación ...

Get TinyML now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.