Capítulo 11. Resolución simple de entidades en grafos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Volviendo a nuestro primer ejemplo de este libro, ¿cómo sabes quién es tu cliente en tu modelo C360?

¿Tienes un identificador fuerte en tu conjunto de datos, como un número de la seguridad social o el carné de socio? ¿Hasta qué punto confías en que esos identificadores, y su fuente, representen a personas únicas con una precisión del 100%?

Las distintas industrias tienen distintos niveles de tolerancia a la imprecisión.

En sanidad, los falsos positivos pueden llevar a diagnósticos erróneos y a distribuciones de medicamentos potencialmente mortales. Por otra parte, si trabajas con datos sobre películas, una resolución incorrecta de las mismas dará lugar a una experiencia de usuario poco fluida para tu aplicación, pero al menos no estamos hablando de que la vida de alguien esté en juego.

El problema de deducir quién es quién y qué es qué a partir de las claves y valores de tu fuente de datos ha sido un reto desde que empezamos a escribir información sobre las personas. Este problema se denomina resolución de entidades y tiene una larga historia de soluciones técnicas.

Para cualquier equipo que trabaje en la resolución de entidades, es importante hacer las cosas bien dentro del margen de error que sea aceptable en tu ámbito empresarial.

Avance de capítulo: Fusionar varios conjuntos de datos en un gráfico

En este ...

Get Guía del profesional de los datos gráficos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.