Capítulo 6. Emparejamiento de empresas

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En, Capítulo 5, examinamos el reto de resolver un conjunto más amplio de entidades individuales, haciendo coincidir el nombre y la fecha de nacimiento. En este capítulo, consideramos otro escenario típico, la resolución de entidades organizativas para que podamos obtener una imagen más completa de su negocio.

Quizá podríamos utilizar la fecha de constitución de la organización como discriminador, de forma similar a como utilizamos la fecha de nacimiento para ayudar a identificar a los individuos únicos. Sin embargo, esta información sobre la fecha de constitución no suele incluirse en los conjuntos de datos de las organizaciones; es mucho más habitual que una empresa se identifique por su domicilio social.

Por lo tanto, en este capítulo, utilizaremos la información sobre la dirección de la empresa, junto con los nombres de las empresas, para identificar posibles coincidencias. A continuación, estudiaremos cómo evaluar un nuevo registro en busca de coincidencias con las fuentes de datos originales, sin tener que realizar un reentrenamiento del modelo que lleve mucho tiempo.

Ejemplo de problema

En este capítulo, resolveremos una lista de nombres de empresas que publica la Agencia Marítima y de Guardacostas del Reino Unido (MCA) comparándola con los datos básicos de la organización publicados en el registro del Registro de Sociedades. ...

Get Resolución práctica de entidades now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.