Capítulo 6. Análisis de componentes principales

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El análisis de componentes principales, o ACP, es uno de los pequeños milagros del aprendizaje automático. Es una técnica de reducción de la dimensionalidad que reduce el número de dimensiones de un conjunto de datos sin sacrificar una cantidad proporcional de información. Aunque a primera vista pueda parecer decepcionante, tiene profundas implicaciones para los ingenieros y desarrolladores de software que trabajan para construir modelos predictivos a partir de sus datos.

¿Y si te dijera que puedes tomar un conjunto de datos con 1.000 columnas, utilizar el ACP para reducirlo a 100 columnas y conservar el 90% o más de la información del conjunto de datos original? Eso es relativamente común, lo creas o no. Y se presta a una gran variedad de usos prácticos, entre ellos:

  • Reducir los datos de alta dimensión a dos o tres dimensiones para poder trazarlos y explorarlos

  • Reducir el número de dimensiones de un conjunto de datos y luego restablecer el número original de dimensiones, lo que encuentra aplicación en la detección de anomalías y el filtrado de ruido.

  • Anonimizar conjuntos de datos para que puedan compartirse con otros sin revelar la naturaleza o el significado de los datos.

Y eso no es todo. Un efecto secundario de aplicar el ACP a un conjunto de datos es que se eliminan las características menos importantes ...

Get Aprendizaje Automático Aplicado e IA para Ingenieros now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.