Capítulo 8. Aprendizaje automático con BigQuery ML

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

BigQuery es un almacén de datos sin servidor y altamente escalable. Sorprendentemente, también es una excelente plataforma de aprendizaje automático. Esta combinación es muy conveniente, ya que puedes hacer aprendizaje automático sin tener que extraer datos del almacén de datos. Si tu organización tiene muchos datos sensibles para la privacidad o confidenciales, no tener extractos de datos flotando en los proyectos de la gente es importante para la seguridad. La auditabilidad que ofrece BigQuery desde el primer momento significa que sabes exactamente quién creó el modelo y qué datos se utilizaron en cada modelo.

Dada la escalabilidad, potencia, facilidad de uso y seguridad de BigQuery ML, recomiendo utilizarlo, en lugar de Spark, para el primer modelo de aprendizaje automático que debes construir cuando trabajes con datos tabulares. De hecho, como verás en este capítulo, puedes obtener la mejor precisión, capacidad de explicación y capacidad de predicción de su clase utilizando BigQuery ML. Gracias a sus conexiones con Vertex AI, también puede ser tu marco de aprendizaje automático de producción.

Todos los fragmentos de código de este capítulo están disponibles en la carpeta 08_bqml del repositorio GitHub del libro. Consulta el archivo README.md de ese directorio para obtener instrucciones sobre cómo realizar los ...

Get Ciencia de Datos en la Plataforma en la Nube de Google, 2ª Edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.