Capítulo 6. Transformacionesindependientes del modelo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Ahora nos centraremos en cómo escribir la lógica de transformación de datos para los canales de características. Como explicamos en el capítulo 2, los canales de características son programas que ejecutan transformaciones de datos independientes del modelo para producir características reutilizables que se almacenan en el almacén de características. Es decir, los datos de características creados podrían ser utilizados por muchos modelos diferentes, no solo por el primer modelo para el que estás desarrollando el canal de características. La reutilización de características da como resultado características de mayor calidad gracias al aumento de su uso y prueba, la reducción de los costes de almacenamiento y la reducción de los costes operativos y de desarrollo de características. Y recuerda, el canal de características más económico es aquel que no tienes que crear.
Algunos ejemplos de transformaciones independientes del modelo (MIT) son las transformaciones de extracción, validación, agregación y compresión (EVAC):
-
Extracción de características (características retardadas, agrupación y fragmentación para LLMs)
-
Validación de datos (con Great Expectations) y limpieza de datos
-
Agregación (recuentos y sumas para ventanas de tiempo)
-
Compresión (incrustaciones vectoriales)
También veremos cómo podemos componer ...