Conclusión
En el Capítulo 1, hablamos de los objetivos del análisis de datos, de cómo proporcionar orientación basada en datos utilizando modelos estadísticos y de aprendizaje automático, y de las funciones que implicará este trabajo en el futuro. También formulamos nuestro problema de estudio de caso: recomendar a un viajero si debe cancelar una reunión programada en función de la probabilidad de que el vuelo en el que viaja se retrase.
En el Capítulo 2, automatizamos la ingesta de datos de vuelos del sitio web de la Oficina de Estadísticas de Transporte. Empezamos haciendo ingeniería inversa de un formulario web, escribiendo scripts en Python para descargar los datos necesarios y almacenándolos en Google Cloud Storage. Por último, hicimos el proceso de ingesta sin servidor creando una aplicación Cloud Run para llevar a cabo la ingesta y la hicimos invocable desde Cloud Scheduler.
En el Capítulo 3, explicamos por qué era importante incorporar los puntos de vista de los usuarios finales a nuestros esfuerzos de modelado de datos lo antes posible. Lo conseguimos creando un cuadro de mando en Data Studio y rellenándolo desde Cloud SQL. El panel se utilizó para explicar un sencillo modelo de tabla de contingencia que predecía la probabilidad de llegada a tiempo mediante el umbral del retraso de salida del vuelo.
En el Capítulo 4, simulamos los datos de vuelo como si llegaran en tiempo real, utilizamos la simulación para rellenar los mensajes en Cloud Pub/Sub, y luego procesamos los ...
Get Ciencia de Datos en la Plataforma en la Nube de Google, 2ª Edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.