book

Design de sistemas na AWS

by Jayanth Kumar, Mandeep Singh

March 2025

Intermediate to advanced

612 pages

19h 42m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Read now

Unlock full access

Como este livro está organizadoO que este livro não éQuem deve ler este livroConvenções utilizadas neste livroAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentosMandeep SinghJayanth Kumar
Conceitos de conceção de sistemasComunicaçãoConsistênciaDisponibilidadeFiabilidadeEscalabilidadeCapacidade de manutençãoTolerância a falhasFalácias da computação distribuídaSoluções de compromisso na conceção do sistemaTempo versus espaçoLatência versus taxa de transferênciaDesempenho versus escalabilidadeConsistência versus disponibilidadeDiretrizes de conceção do sistemaDiretriz de isolamento: Constrói-o de forma modularDiretriz de Simplicidade: Mantém as coisas simples, toloDiretriz de desempenho: As métricas não mentemOrientações de compromisso: Não existe almoço grátisOrientação de casos de utilização: Depende sempreConclusão
Formato de armazenamento de dadosArmazenamento baseado em ficheirosArmazenamento baseado em blocosArmazenamento baseado em objectosBases de dados relacionaisConceitos de bases de dados relacionaisArquitetura de sistemas de gestão de bases de dados relacionaisOtimização de bases de dados relacionaisDimensionamento de bases de dados relacionaisSistemas de bases de dados relacionais de código abertoConclusão
Conceitos de bases de dados não relacionaisFlexibilidade do esquemaModelos de dadosEscalabilidadeAlta Disponibilidade e Tolerância a FalhasBASEBases de dados de valores chaveModelo de dadosOperações de acesso e recuperação de dadosEscalonamento de armazenamentos de valores chaveDisponibilidade em armazenamentos de valores chaveVantagens, soluções de compromisso e consideraçõesDynamo: Base de dados chave-valorBases de dados de documentosModelo de dadosDisponibilidade em armazenamentos de documentosVantagens, soluções de compromisso e consideraçõesMongoDB: Base de dados de documentos de código abertoBases de dados colunaresModelo de dadosNíveis de consistênciaArquitetura de armazenamento colunarVantagens, soluções de compromisso e consideraçõesApache Cassandra: Base de dados colunar de código abertoBases de dados de grafosModelo de dadosAcesso e recuperação de dadosVantagens, soluções de compromisso e consideraçõesNeo4j: Base de dados de gráficos de código abertoConclusão
Vantagens do armazenamento em cachePolíticas de despejo da CacheAlgoritmo de BeladyPolíticas baseadas em filas de esperaPolíticas baseadas na recênciaPolíticas baseadas na frequênciaPolítica da lista de permissõesInvalidação da cacheEstratégias de armazenamento em cacheEstratégias de leitura intensivaEstratégias de escrita intensivaImplementação da cacheCache em processoCache interprocessosCache remotoEscolher uma abordagem de implementação de cacheMecanismos de cacheRedes de distribuição de conteúdosEmpurra CDNsPuxa CDNsSoluções de cache de código abertoMemcachedRedisConclusão
Componentes de Network+Benefícios do balanceamento de cargaEstratégias de implantação e colocação de LBBalanceamento global de carga do servidorBalanceamento de carga localAlgoritmos de balanceamento de cargaAlgoritmos de balanceamento de carga estáticaAlgoritmos de balanceamento dinâmico de cargaPersistência de sessão em LBsBalanceadores de carga com estadoBalanceadores de carga sem estadoTipos de balanceadores de cargaTipos de LB baseados na funcionalidadeTipos de LB baseados na configuraçãoNginx: Balanceador de carga de código abertoConclusão
Modelos e protocolos de comunicaçãoModelo OSIModelo TCP/IPTipos de comunicaçãoMecanismo de extração: Polling HTTPMecanismo de envio: WebSocketsMecanismo de envio: Eventos enviados pelo servidorNormas comuns de protocolo de comunicaçãoChamada de procedimento remotoRESTGraphQLComunicação em tempo real na WebConclusão
Evolução da implementação de aplicaçõesContentorizaçãoDockerOrquestração de contentoresEstratégias de implementação de contentoresPipeline CI/CD com Gitflow e estratégias de implantação automatizadaFluxo de trabalho do Gitflow para gerenciamento de filiaisIntegração contínuaImplantação contínuaMonitorização e gestão de incidentesConclusão

Altera a captura de dadosArquitetura editor/assinanteCorretores de mensagensFilas de mensagensCoreografia e OrquestraçãoCoreografiaOrquestraçãoDecidir entre coreografia e orquestraçãoArquitetura de Grandes DadosArquitetura LambdaKappa ArquiteturaArquitetura do lago de dadosArquitetura de soluçõesMonólitosArquitecturas de N camadasMicrosserviçosArquitetura orientada para eventosConceitos e implementações de EDAParadigmas de implementações orientadas por eventosPadrões comuns de arquitetura CloudPadrões baseados em eventos: CQRS e SagaPadrões tolerantes a falhas: Circuit Breaker, Retry with Backoff e Rate LimiterPadrões baseados no domínio: Design orientado para o domínio e Decomposição por subdomíniosEstratégias e padrões de encaminhamento de APIOutros padrões de arquitetura CloudArquitetura de sistemas distribuídos de código abertoHDFSApache Kafka: Fila de mensagens distribuídaComparação entre o HDFS e o KafkaConclusão
Começa a utilizar o AWSRegiões da AWSZonas de disponibilidade do AWSZonas locais da AWSLocalizações do AWS EdgeIntrodução aos serviços de Network+ da AWSAmazon VPCSub-redesConectividade com a InternetTabelas de rotasGrupos de segurançaListas de controlo de acesso à redeConectividade entre Amazon VPC e InternetConectividade entre Amazon VPCsConectividade híbridaAmazon Route 53AWS Elastic Load BalancerGateway de API da AmazonAmazon CloudFrontConclusão
Armazenamento em Cloud na AWSAmazon Elastic Block StoreSistema de ficheiros elástico da AmazonServiço de armazenamento simples da AmazonBases de dados AWSAmazon RDSAmazon DynamoDBAmazon DocumentDBAmazon NeptuneAmazon ElastiCacheAmazon OpenSearchAmazon TimestreamEspaços-chave da AmazonConclusão
Amazon Elastic Compute CloudImagem da máquina AmazonTipo de instânciaEscala automáticaAWS LambdaServiços de contentorizaçãoAmazon Elastic Container ServiceServiço Amazon Elastic KubernetesConclusão
Amazon Managed Streaming para o Apache KafkaAmazon KinesisFluxos de dados do Amazon KinesisAnálise de dados do Amazon KinesisMangueira de dados do Amazon KinesisFluxos de vídeo do Amazon KinesisServiço Amazon Simple QueueServiço de notificação simples da AmazonOrquestração do fluxo de trabalhoFunções AWS StepFluxo de trabalho gerido pela Amazon para o Apache AirflowAmazon CloudWatchRegistos de aplicaçõesMétricas e alarmesGestão de Identidade e Acesso AWSCognição da AmazóniaAWS AppSyncConclusão
AWS Big Data and AnalyticsAmazon Elastic MapReduceCola AWSAmazon AthenaAmazon QuickSightAmazon RedshiftAprendizagem automática na AWSAmazon SageMakerAWS ML Application ServicesInfraestrutura ML da AWSConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaEspaço de armazenamentoComeçando pelo designAlgoritmo de encurtamento de URLAPIs do sistemaConsiderações sobre o sistemaSeleção da base de dadosSuporte a domínios personalizadosIniciar o sistema no AWSArquitetura do dia zeroEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designConceber o Web CrawlerConceber o motor de buscaIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designManuseamento de novas mensagensGerir as ligações de utilizadorServiço de pesquisaIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designConceitos e princípiosUma conceção aproximada do sistemaIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designArquitetura de integração de propriedadesPesquisa de imóveis ArquiteturaArquitetura de reserva de imóveisComentários de imóveis ArquiteturaIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designArquitetura de mensagensArquitetura WhatsApp com ErlangIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designCodificação de vídeoValidação da qualidade do vídeoIndexação de conteúdosDistribuição de conteúdosIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão
Requisitos do sistemaRequisitos funcionais e não funcionaisEscala do sistemaComeçando pelo designConceber um sistema de marcação de acçõesConceber o sistema de gestão de encomendasProjetando sistemas de latência ultrabaixaConstruir o painel de controlo de lucros e perdasIniciar o sistema no AWSDia 0 ArquiteturaEscalar para milhões e mais alémArquitetura Day NConclusão

Content preview from Design de sistemas na AWS

Capítulo 15. Projetando um Web Crawler e um Mecanismo de Pesquisa

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Tu planeaste uma reunião com os teus entes queridos durante a época festiva. Adoras cozinhar e decidiste cozinhar tudo sozinho, mas não tens as receitas dos pratos que queres preparar. Qual é a melhor solução possível? Podias perguntar aos teus amigos se têm as receitas ou procurar em livros de receitas, mas uma solução simples e eficaz é utilizar a pesquisa no Google. O Google procura em toda a Internet e encontra os melhores resultados sobre como preparar um prato específico. Como é que o Google percorre um mar tão vasto de informações e encontra a resposta perfeita? Neste capítulo, vamos tentar perceber isso, analisando a arquitetura de tais sistemas de pesquisa.

A um nível elevado, todo o sistema consiste em dois subsistemas: um rastreador da Web e um motor de pesquisa, como se mostra na Figura 15-1. Um Web crawler é essencialmente um software responsável por rastrear o conteúdo da Web. O conteúdo da Internet está a crescer exponencialmente e os web crawlers precisam de rastrear regularmente o conteúdo para manter os resultados mais actualizados. O motor de pesquisa está em cima do conteúdo acumulado pelos Web crawlers e armazena-o de forma a poder procurar palavras-chave pesquisadas pelo utilizador no conteúdo e apresentar os resultados mais úteis.

Com este conhecimento básico, vamos começar ...