Capítulo 7. Entrenar a tu primer modelo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el capítulo anterior, utilizamos los Trabajos de Procesamiento de SageMaker para transformar un conjunto de datos sin procesar en características utilizables por la máquina mediante el proceso de "ingeniería de características". En este capítulo, utilizamos estas características para entrenar un clasificador de reseñas personalizado utilizando TensorFlow, PyTorch, BERT y SageMaker para clasificar reseñas "in the wild" de canales sociales, sitios web asociados, etc. ¡Incluso mostramos cómo entrenar un modelo BERT con Java!

Por el camino, explicamos conceptos clave como la arquitectura Transformers, BERT y el ajuste fino de los modelos preentrenados. También describimos las distintas opciones de entrenamiento que ofrece SageMaker, incluidos los algoritmos incorporados y las opciones de "traiga su propio modelo". A continuación, analizamos la infraestructura de SageMaker, incluidos los contenedores, las redes y la seguridad. A continuación, entrenaremos, evaluaremos y perfilaremos nuestros modelos con SageMaker. La creación de perfiles nos ayuda a depurar nuestros modelos, reducir el tiempo de entrenamiento y reducir el coste. Por último, ofrecemos consejos para reducir aún más los costes y aumentar el rendimiento al desarrollar modelos con SageMaker.

Comprender la infraestructura de SageMaker

Basado en gran medida en el ...

Get Ciencia de datos en AWS now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.