Capítulo 18. Manejar duplicados

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

18.0 Introducción

Las tablas o conjuntos de resultados a veces contienen filas duplicadas. En algunos casos, esto esaceptable. Por ejemplo, si realizas una encuesta web que registra la fecha y el número IP del cliente junto con los votos, las filas duplicadas pueden estar permitidas porque es posible que un gran número de votos parezcan originarse en el mismo número IP para un servicio de Internet que dirige el tráfico de sus clientes a través de un único host proxy. En otros casos, los duplicados son inaceptables, y querrás tomar medidas para evitarlos. Las operaciones implicadas en la gestión de filas duplicadas incluyen las siguientes:

  • Evitar que se creen duplicados en primer lugar. Si cada fila de una tabla está destinada a representar una única entidad (como una persona, un artículo de un catálogo o una observación concreta de un experimento), la aparición de duplicados hace imposible referirse a cada fila sin ambigüedades, por lo que es mejor asegurarse de que nunca se produzcan duplicados.

  • Contar el número de duplicados para determinar si están presentes y en qué medida.

  • Identificar los valores duplicados (o las filas que los contienen) para que puedas ver dónde se producen.

  • Eliminar duplicados para garantizar que cada fila es única. Esto puede implicar eliminar filas de una tabla para dejar sólo filas únicas o seleccionar un conjunto ...

Get Libro de cocina de MySQL, 4ª edición now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.