Overview
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
A resolução de entidades é uma técnica analítica fundamental que te permite identificar vários registos de dados que se referem à mesma entidade do mundo real. Com este guia prático, os gestores de produtos, analistas de dados e cientistas de dados aprenderão a acrescentar valor aos dados através da limpeza, análise e resolução de conjuntos de dados utilizando bibliotecas Python de código aberto e APIs Cloud.
O autor Michael Shearer mostra-te como aumentar a escala dos teus processos de correspondência de dados e melhorar a precisão das tuas reconciliações. Poderás remover entradas duplicadas dentro de uma única fonte e juntar fontes de dados díspares quando não estiverem disponíveis chaves comuns. Utilizando exemplos de dados do mundo real, este livro ajuda-te a adquirir conhecimentos práticos para acelerar a entrega de valor comercial real.
Com a resolução de entidades, criarás activos de dados ricos e abrangentes que revelam relações para fins de marketing e gestão de riscos, essenciais para aproveitar todo o potencial do ML e da IA. Este livro abrange:
- Desafios na desduplicação e junção de conjuntos de dados
- Extrair, limpar e preparar conjuntos de dados para correspondência
- Algoritmos de correspondência de texto para identificar entidades equivalentes
- Técnicas para deduplicar e juntar conjuntos de dados em escala
- Correspondência de conjuntos de dados contendo pessoas e organizações
- Avaliação das correspondências de dados
- Otimização e afinação de algoritmos de correspondência de dados
- Resolução de entidades utilizando APIs Cloud
- Correspondência usando tecnologias que aumentam a privacidade