Capítulo 8. Ampliación en Google Cloud

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En este capítulo, trabajaremos sobre cómo escalar nuestro proceso de resolución de entidades para permitirnos emparejar grandes conjuntos de datos en plazos razonables. Utilizaremos un clúster de máquinas virtuales que se ejecutan en paralelo en Google Cloud Platform (GCP) para dividir la carga de trabajo y reducir el tiempo necesario para resolver nuestras entidades.

Veremos cómo registrar una nueva cuenta en la Plataforma en la Nube y cómo configurar los servicios de almacenamiento y computación que necesitaremos. Una vez que nuestra infraestructura esté lista, volveremos a ejecutar nuestro ejemplo de comparación de empresas del Capítulo 6, dividiendo los pasos de entrenamiento del modelo y resolución de entidades en un clúster gestionado de recursos informáticos.

Por último, comprobaremos que nuestro rendimiento es constante y nos aseguraremos de poner orden por completo, eliminando el clúster y devolviendo las máquinas virtuales que hemos tomado prestadas para asegurarnos de que no seguimos acumulando gastos adicionales.

Get Resolución práctica de entidades now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.