book

Bancos de dados de streaming

Name: Bancos de dados de streaming
ISBN: 9798341637610

by Hubert Dulay, Ralph Matthias Debusmann

March 2025

Beginner to intermediate

260 pages

7h 25m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Read now

Unlock full access

Prefácio
Prefácio
Convenções utilizadas neste livroUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentos de HubertAgradecimentos do Ralph
1. Fundamentos do streaming
Vira a base de dados do avessoExternalização de caraterísticas de banco de dadosEscreve um diárioPlataformas de streamingVistas materializadasCaso de utilização: Análise de fluxo de cliquesCompreender as transacções e os eventosDesign orientado para o domínioEnriquecimento do contextoAltera a captura de dadosConectoresConector MiddlewareIncorporadoConstruído à medidaResumo
2. Plataformas de processamento de fluxos
Transformações com estadoPipelines de dadosLimitações do ELTProcessamento de fluxos com ELTProcessadores de fluxoProcessadores de fluxo popularesProcessadores de fluxo contínuo mais recentesEmulando visualizações materializadas no Apache SparkDois tipos de cursos de águaAnexar fluxoDados de alteração do DebeziumVistas materializadasResumo
3. Servir dados em tempo real
Expectativas em tempo realEscolher um armazenamento de dados analíticosObtenção de fontes de suprimento a partir de um tópicoTransformações de ingestãoOLTP versus OLAPÁCIDOOtimização baseada em linhas e colunasConsultas por segundo e simultaneidadeIndexaçãoServir resultados analíticosConsultas síncronasConsultas assíncronasConsultas push versus pullResumo
4. Vistas materializadas
Visualizações, visualizações materializadas e atualizações incrementaisAltera a captura de dadosConsultas push versus pullCDC e UpsertUnir fluxosApache CalciteCaso de utilização do fluxo de cliquesResumo
5. Introdução às bases de dados em fluxo contínuo
Identificação da base de dados de streamingBase de dados em fluxo contínuo baseada em colunasBase de dados em fluxo contínuo baseada em linhasBases de dados de fluxo contínuo de extremidadesExpressividade SQLDepuração de streamingVantagens da depuração em bases de dados em fluxo contínuoSQL não é uma bala de prataImplementações de bases de dados em fluxo contínuoArquitetura da base de dados em fluxo contínuoELT com bases de dados em fluxo contínuoResumo
6. Consistência
Um exemplo de brinquedoTransacçõesAnalisar as transacçõesComparação da consistência entre sistemas de processamento de fluxosFlink SQLksqlDBProton (Timeplus)RisingWaveMaterializaPercursoMensagens fora de ordemGo beyond Eventual ConsistencyPorque é que os Processadores de Fluxo Eventualmente Consistentes falham no Exemplo Toy?Como é que os sistemas de processamento de fluxos internamente consistentes passam o exemplo do Toy?Como podemos corrigir sistemas de processamento de fluxo eventualmente consistentes para passar o exemplo do brinquedo?Consistência versus LatênciaResumo
7. Emergência de outros sistemas de dados híbridos
Planos de dadosBase de dados transacional/analítica híbridaOutras bases de dados híbridasMotivações para os sistemas híbridosA Influência do PostgreSQL em Bases de Dados HíbridasAnálise de ponta a pontaBases de dados híbridas da próxima geraçãoBases de dados OLTP de fluxo contínuo da próxima geraçãoBases de dados RTOLAP de fluxo contínuo da próxima geraçãoBases de dados HTAP da próxima geraçãoResumo
8. Zero-ETL ou quase-Zero-ETL
Modelo ETLZero-ETLQuase zero-ETLPeerDBProtãoOLAP incorporadoGravidade e replicação de dadosRedução de dados analíticosArquitetura LambdaTabelas híbridas Apache PinotConfigurações de condutasResumo

9. O Plano de Fluxo
Gravidade dos dadosComponentes do plano de streamingInfraestrutura do plano de streamingAnálise operacionalData MeshPilares de um Data MeshDesafio de um Data MeshStreaming Data Mesh com Streaming Plane e Streaming DatabasesLocalidade dos dadosReplicação de dadosResumo
10. Modelos de implantação
Base de dados em fluxo contínuo consistenteProcessador de fluxo contínuo consistente e RTOLAPBase de dados OLAP em fluxo contínuo eventualmente consistenteProcessador de fluxo contínuo eventualmente consistente e RTOLAPProcessador de fluxo contínuo eventualmente consistente e HTAPksqlDBAtualização da visão incrementalWrapper de dados estrangeiros do Postgres MulticornQuando usar processadores de fluxo baseados em códigoQuando utilizar as tecnologias Lakehouse/StreamhouseTecnologias de armazenamento em cacheOnde fazer o processamento e a consulta em geral?As quatro perguntas "Onde"?Um caso de utilização analíticaConsequênciasResumo
11. Estado futuro dos dados em tempo real
A Convergência dos Planos de DadosBases de dados de grafosMemógrafothatDot/QuineBases de dados vetoriaisMilvus 2.x: Streaming como Backbone CentralBases de dados RTOLAP: Adicionando Pesquisa VetorialAtualização da visão incrementalpg_ivmHidraEpsioFelderaPeerDBEnvolvimento de dados e Postgres MulticornBases de dados clássicasArmazéns de dadosBigQueryRedshiftSnowflakeCasa do lagoDelta LakeApache PaimonApache IcebergApache HudiOneTable ou XTableA relação entre Streaming e LakehousesConclusão
Índice
Sobre os autores

Content preview from Bancos de dados de streaming

Capítulo 8. Zero-ETL ou Quase-Zero-ETL

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

No Capítulo 7, apresentamos as bases de dados híbridas emergentes que fornecem soluções alternativas para suportar a análise em tempo real. Estes sistemas reduzem a infraestrutura e tornam os dados mais acessíveis às cargas de trabalho analíticas. Como os sistemas híbridos convergem sistemas que são tradicionalmente distribuídos, supõe-se que os sistemas híbridos se inclinam para um sistema monólito. Os sistemas monólitos são normalmente conhecidos pela falta de modularidade e escalabilidade na execução de cargas de trabalho de dados.

Ironicamente, a quebra de um sistema de dados monólito vai fazer-nos voltar a decompor uma base de dados e virá-la do avesso para escalar especificamente os componentes individuais. Esta não é necessariamente uma solução negativa. Neste livro, propusemos colocar esses sistemas de volta na base de dados para reduzir a complexidade e o custo, que são tradicionalmente associados a grandes sistemas distribuídos.

A ETL é a forma como movemos os dados de sistema para sistema, transformando-os ao longo do caminho. Até agora, usámos uma forma de ETL chamada streaming SQL. Neste capítulo, falaremos sobre como equilibrar complexidade e escalabilidade na implementação do ETL, analisando os sistemas e padrões existentes usados atualmente para distribuir e escalar cargas de trabalho de dados.

Modelo ETL ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341637610

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Bancos de dados de streaming

by Hubert Dulay, Ralph Matthias Debusmann

Capítulo 8. Zero-ETL ou Quase-Zero-ETL

Modelo ETL ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.