Modelos de aprendizagem automática e ciência de dados para finanças
by Hariom Tatsat, Sahil Puri, Brad Lookabaugh
Capítulo 7. Aprendizagem não supervisionada: Redução de dimensionalidade
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Nos capítulos anteriores, utilizámos técnicas de aprendizagem supervisionada para criar modelos de aprendizagem automática utilizando dados em que a resposta já era conhecida (ou seja, as etiquetas das classes estavam disponíveis nos nossos dados de entrada). Agora vamos explorar a aprendizagem não supervisionada, em que fazemos inferências a partir de conjuntos de dados que consistem em dados de entrada quando a resposta é desconhecida. Os algoritmos de aprendizagem não supervisionada tentam inferir padrões a partir dos dados sem qualquer conhecimento do resultado que os dados devem produzir. Sem exigir dados rotulados, que podem ser demorados e impraticáveis de criar ou adquirir, esta família de modelos permite a utilização fácil de conjuntos de dados maiores para análise e desenvolvimento de modelos.
A redução da dimensionalidade é uma técnica fundamental na aprendizagem não supervisionada. Comprime os dados encontrando um conjunto menor e diferente de variáveis que capturam o que é mais importante nas caraterísticas originais, minimizando a perda de informações. A redução da dimensionalidade ajuda a mitigar os problemas associados à elevada dimensionalidade e permite a visualização de aspectos salientes de dados de dimensão superior que, de outra forma, seriam difíceis de explorar.