Skip to Content
Creación de sistemas de aprendizaje automático con un almacén de características
book

Creación de sistemas de aprendizaje automático con un almacén de características

by Jim Dowling
November 2025
Intermediate to advanced
508 pages
16h 53m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Creación de sistemas de aprendizaje automático con un almacén de características

Capítulo 7. Transformacionesdependientes del modelo y bajo demanda

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, analizaremos las transformaciones de datos en los procesos de entrenamiento e inferencia y cómo garantizar que las transformaciones en ambos procesos sean equivalentes. En el capítulo 2, introdujimos las transformaciones dependientes del modelo (MDT) como transformaciones de datos que se realizan sobre los datos después de que se hayan leído del almacén de características y que crean características específicas para un modelo. Existen dos grandes clases de MDT: las transformaciones de características (para características numéricas y categóricas) y las transformaciones que están estrechamente vinculadas a un solo modelo. Un ejemplo de las primeras es la codificación one-hot de variables categóricas, mientras que un ejemplo de las segundas es la codificación de texto para un LLM.

También analizamos cómo evitar el sesgo entre las MDT que se aplican por separado en los procesos de entrenamiento e inferencia. Esto no siempre es tan trivial como aplicar la misma función versionada en ambos procesos, ya que muchas MDT son dependientes del estado y requieren el mismo estado (las estadísticas de los datos de entrenamiento del modelo) como parámetro en ambos procesos. Comenzamos presentando ejemplos comunes de transformaciones de características y diferentes clases de transformaciones específicas ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Fundamentos de la visualización de datos

Fundamentos de la visualización de datos

Claus O. Wilke
Aprendizaje automático práctico para visión por ordenador

Aprendizaje automático práctico para visión por ordenador

Valliappa Lakshmanan, Martin Görner, Ryan Gillard
Desarrollo sin servidor en AWS

Desarrollo sin servidor en AWS

Sheen Brisals, Luke Hedger

Publisher Resources

ISBN: 0642572279486Supplemental Content