Skip to Content
Algoritmos de dados com o Spark
book

Algoritmos de dados com o Spark

by Mahmoud Parsian
April 2025
Intermediate to advanced
438 pages
10h 4m
Portuguese (Portugal, Brazil)
O'Reilly Media, Inc.
Book available
Content preview from Algoritmos de dados com o Spark

Capítulo 9. Padrões clássicos de design de dados

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Este capítulo discute alguns dos padrões de design de dados mais fundamentais e clássicos utilizados na grande maioria das soluções de big data. Apesar de serem padrões de projeto simples, eles são úteis para resolver muitos problemas comuns de dados, e eu usei muitos deles em exemplos neste livro. Neste capítulo, apresentarei as implementações do PySpark dos seguintes padrões de projeto:

  1. Entrada-Mapa-Saída

  2. Entrada-Filtro-Saída

  3. Input-Map-Reduce-Output

  4. Input-Multiple-Maps-Reduce-Output

  5. Input-Map-Combiner-Reduce-Output

  6. Input-MapPartitions-Reduce-Output

  7. Entrada-invertida-índice-padrão-saída

Antes de começarmos, no entanto, gostaria de abordar a questão do que quero dizer com "padrões de design". Em ciência da computação e engenharia de software, dado um problema que ocorre comumente, um padrão de projeto é uma solução reutilizável para esse problema. É um modelo ou melhor prática de como resolver um problema, não um projeto acabado que pode ser transformado diretamente em código. Os padrões apresentados neste capítulo irão equipá-lo para lidar com uma ampla gama de tarefas de análise de dados.

Nota

Os padrões de projeto de dados discutidos neste capítulo são padrões básicos. Podes criar os teus ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Escala o aprendizado de máquina com o Spark

Escala o aprendizado de máquina com o Spark

Adi Polak

Publisher Resources

ISBN: 9798341642799Supplemental Content