Capítulo 5. Preprocesamiento de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Los datos que utilizamos para entrenar nuestros modelos de aprendizaje automático a menudo se proporcionan en formatos que nuestros modelos de aprendizaje automático no pueden consumir. Por ejemplo, en nuestro proyecto de ejemplo, una característica que queremos utilizar para entrenar nuestro modelo sólo está disponible como etiquetas Sí y No. Cualquier modelo de aprendizaje automático requiere una representación numérica de estos valores (por ejemplo, 1 y 0). En este capítulo, explicaremos cómo convertir las características en representaciones numéricas coherentes para que tu modelo de aprendizaje automático pueda entrenarse con las representaciones numéricas de las características.
Un aspecto importante que tratamos en este capítulo es centrarnos en un preprocesamiento coherente. Como se muestra en la Figura 5-1, el preprocesamiento tiene lugar después de la validación de los datos, de la que hablamos en el Capítulo 4. La Transformación TensorFlow (TFT), el componente TFX para el preprocesamiento de datos, nos permite construir nuestros pasos de preprocesamiento como gráficos TensorFlow. En los siguientes apartados, analizaremos por qué y cuándo es un buen flujo de trabajo y cómo exportar los pasos del preprocesamiento. En el Capítulo 6, utilizaremos los conjuntos de datos preprocesados y el gráfico de transformación conservado ...
Get Construir Pipelines de Aprendizaje Automático now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.