Capítulo 12. Deteção de objectos
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
O capítulo anterior de apresentou dois algoritmos populares para detetar rostos em fotografias: Viola-Jones, que se baseia na aprendizagem automática, e MTCNNs, que se baseia na aprendizagem profunda. A deteção de rostos é um caso especial de deteção de objectos, em que os computadores detectam e identificam objectos em imagens. Identificar um objeto é um problema de classificação de imagens, algo em que as CNNs são excelentes. Mas encontrar objectos para identificar representa um desafio diferente.
A deteção de objectos é um desafio porque não se presume que os objectos estejam perfeitamente recortados e alinhados, como acontece nas tarefas de classificação de imagens. Também não estão limitados a um por imagem. A Figura 12-1 mostra o que um carro autónomo pode ver quando analisa quadros de vídeo de uma câmara apontada para a frente. Uma CNN treinada para fazer a classificação convencional de imagens utilizando imagens de treino cuidadosamente preparadas é incapaz de ajudar. Pode ser capaz de classificar a imagem como uma rua da cidade, mas não consegue determinar se a imagem contém carros, pessoas e semáforos, e muito menos identificar a sua localização.
A deteção de objectos tem crescido em velocidade e precisão nos últimos anos, e os métodos mais avançados baseiam-se na Deep Learning. Em particular, utiliza CNNs, que foram ...