Overview
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Aprende como é fácil aplicar métodos sofisticados de estatística e aprendizagem automática a problemas do mundo real quando constróis utilizando o Google Cloud Platform (GCP). Este guia prático mostra aos engenheiros e cientistas de dados como implementar um pipeline de dados de ponta a ponta com ferramentas nativas da Cloud no GCP.
Ao longo desta segunda edição actualizada, trabalharás com um exemplo de decisão empresarial, utilizando uma variedade de abordagens de ciência de dados. Acompanha a construção de um pipeline de dados no teu próprio projeto no GCP e descobre como resolver problemas de ciência de dados de uma forma transformadora e mais colaborativa.
Aprenderás a:
- Emprega as melhores práticas na criação de pipelines de dados e ML altamente escaláveis no Google Cloud
- Automatizar e agendar a ingestão de dados usando o Cloud Run
- Cria e preenche um dashboard no Data Studio
- Constrói um pipeline de análise em tempo real usando Pub/Sub, Dataflow e BigQuery
- Conduzir a exploração interativa de dados com o BigQuery
- Cria um modelo bayesiano com o Spark no Cloud Dataproc
- Prevê séries temporais e faz deteção de anomalias com o BigQuery ML
- Agrega dentro de janelas de tempo com o Dataflow
- Treina modelos de aprendizagem automática explicáveis com a IA vértice
- Operacionaliza o ML com o Vertex AI Pipelines