Capítulo 4. Representación de datos y características de ingeniería
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hasta ahora, hemos supuesto que nuestros datos llegan como una matriz bidimensional de números en coma flotante, donde cada columna es una característica continua que describe los puntos de datos. En muchas aplicaciones, no es así como se recogen los datos. Un tipo de característica especialmente común son las características categóricas. También conocidas como características discretas, no suelen ser numéricas. La distinción entre características categóricas y características continuas es análoga a la distinción entre clasificación y regresión, sólo que en el lado de la entrada y no en el de la salida. Ejemplos de características continuas que hemos visto son el brillo de los píxeles y las medidas del tamaño de las flores de las plantas. Ejemplos de características categóricas son la marca de un producto, el color de un producto o el departamento (libros, ropa, ferretería) en el que se vende. Todas ellas son propiedades que pueden describir un producto, pero no varían de forma continua. Un producto pertenece al departamento de ropa o al de libros. No hay un término medio entre los libros y la ropa, ni un orden natural para las distintas categorías (los libros no son mayores ni menores que la ropa, la ferretería no está entre los libros y la ropa, etc.).
Independientemente de los tipos de características ...