Skip to Content
Creación de sistemas de aprendizaje automático con un almacén de características
book

Creación de sistemas de aprendizaje automático con un almacén de características

by Jim Dowling
November 2025
Intermediate to advanced
508 pages
16h 53m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Creación de sistemas de aprendizaje automático con un almacén de características

Capítulo 6. Transformacionesindependientes del modelo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Ahora nos centraremos en cómo escribir la lógica de transformación de datos para los canales de características. Como explicamos en el capítulo 2, los canales de características son programas que ejecutan transformaciones de datos independientes del modelo para producir características reutilizables que se almacenan en el almacén de características. Es decir, los datos de características creados podrían ser utilizados por muchos modelos diferentes, no solo por el primer modelo para el que estás desarrollando el canal de características. La reutilización de características da como resultado características de mayor calidad gracias al aumento de su uso y prueba, la reducción de los costes de almacenamiento y la reducción de los costes operativos y de desarrollo de características. Y recuerda, el canal de características más económico es aquel que no tienes que crear.

Algunos ejemplos de transformaciones independientes del modelo (MIT) son las transformaciones de extracción, validación, agregación y compresión (EVAC):

  • Extracción de características (características retardadas, agrupación y fragmentación para LLMs)

  • Validación de datos (con Great Expectations) y limpieza de datos

  • Agregación (recuentos y sumas para ventanas de tiempo)

  • Compresión (incrustaciones vectoriales)

También veremos cómo podemos componer ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Fundamentos de la visualización de datos

Fundamentos de la visualización de datos

Claus O. Wilke
Aprendizaje automático práctico para visión por ordenador

Aprendizaje automático práctico para visión por ordenador

Valliappa Lakshmanan, Martin Görner, Ryan Gillard
Desarrollo sin servidor en AWS

Desarrollo sin servidor en AWS

Sheen Brisals, Luke Hedger

Publisher Resources

ISBN: 0642572279486Supplemental Content