Capítulo 4. Almacenesde características
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Como hemos visto en los tres primeros capítulos, la gestión de datos es uno de los aspectos más difíciles de la creación y el funcionamiento de los sistemas de IA. En el último capítulo, utilizamos un almacén de características para crear nuestro sistema de predicción de la calidad del aire. El almacén de características almacenaba los resultados de los procesos de características, proporcionaba datos de entrenamiento para el proceso de entrenamiento y proporcionaba datos de inferencia para el proceso de inferencia por lotes. El almacén de características es una plataforma de datos central que almacena, gestiona y sirve características tanto para el entrenamiento como para la inferencia. También garantiza la coherencia entre las características utilizadas en el entrenamiento y la inferencia, y permite la construcción de sistemas de IA modulares al proporcionar una capa de datos compartida y API bien definidas para conectar los procesos FTI.
En este capítulo, profundizaremos en los almacenes de características y responderemos a las siguientes preguntas:
¿Qué problemas resuelve el almacén de características y cuándo lo necesitas?
¿Qué es un grupo de características, cómo almacena los datos y cómo se escribe en él?
¿Cómo se diseña un modelo de datos para grupos de características?
¿Cómo lees datos de características repartidos ...