Capítulo 1. Introducción Introducción

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

La visualización de datos es en parte arte y en parte ciencia. El reto consiste en hacer bien el arte sin equivocarse en la ciencia, y viceversa. Una visualización de datos debe, ante todo, transmitir con precisión los datos. No debe engañar ni distorsionar. Si una cifra es el doble de grande que otra, pero en la visualización parecen más o menos iguales, entonces la visualización es errónea. Al mismo tiempo, una visualización de datos debe ser estéticamente agradable. Las buenas presentaciones visuales tienden a realzar el mensaje de la visualización. Si una figura contiene colores discordantes, elementos visuales desequilibrados u otras características que distraen, entonces al espectador le resultará más difícil inspeccionar la figura e interpretarla correctamente.

Según mi experiencia, los científicos suelen saber (¡aunque no siempre!) cómo visualizar los datos sin que resulten excesivamente engañosos. Sin embargo, es posible que no tengan un sentido muy desarrollado de la estética visual y que, sin darse cuenta, tomen decisiones visuales que desvirtúen el mensaje deseado. Los diseñadores, por su parte, pueden preparar visualizaciones que parezcan bonitas, pero que jueguen a la ligera con los datos. Mi objetivo es proporcionar información útil a ambos grupos.

Este libro intenta cubrir los principios, métodos y conceptos clave necesarios para visualizar datos para publicaciones, informes o presentaciones. Dado que la visualización de datos es un campo muy amplio, y que en su definición más amplia podría incluir temas tan variados como dibujos técnicos esquemáticos, animaciones en 3D e interfaces de usuario, necesariamente he tenido que limitar mi alcance. Cubro específicamente el caso de las visualizaciones estáticas presentadas en forma impresa, en línea o como diapositivas. El libro no abarca las visualizaciones interactivas ni las películas, salvo en una breve sección delCapítulo 16. Por lo tanto, a lo largo de este libro, utilizaré las palabras "visualización" y "figura" de forma un tanto indistinta. El libro tampoco proporciona ninguna instrucción sobre cómohacer figuras con el software de visualización o las bibliotecas de programación existentes. La bibliografía comentada al final del libro incluye referencias a textos apropiados sobre estos temas.

El libro se divide en tres partes. La primera, "De los datos a la visualización", describe distintos tipos de gráficos y diagramas, como gráficos de barras, de dispersión y circulares. Se centra principalmente en la ciencia de la visualización. En esta parte, en lugar de intentar proporcionar una cobertura enciclopédica de todos los enfoques de visualización concebibles, hablo de un conjunto básico de elementos visuales que probablemente encontrarás en publicaciones y/o necesitarás en tu propio trabajo. Al organizar esta parte, he intentado agrupar las visualizaciones por el tipo de mensaje que transmiten y no por el tipo de datos que se visualizan. Los textos estadísticos suelen describir el análisis y la visualización de datos por tipo de datos, organizando el material por número y tipo de variables (una variable continua, una variable discreta, dos variables continuas, una variable continua y otra discreta, etc.). Creo que sólo los estadísticos encuentran útil esta organización. La mayoría de las demás personas piensan en términos de un mensaje, como el tamaño de algo, cómo está compuesto de partes, cómo se relaciona con otra cosa, etc.

La segunda parte, "Principios del diseño de figuras", trata sobre diversas cuestiones de diseño que surgen al montar visualizaciones de datos. Su énfasis principal, aunque no exclusivo, se centra en el aspecto estético de la visualización de datos. Una vez que hemos elegido el tipo adecuado de gráfico o diagrama para nuestro conjunto de datos, tenemos que tomar decisiones estéticas sobre los elementos visuales, como los colores, los símbolos y el tamaño de las fuentes. Estas elecciones pueden afectar tanto a la claridad de una visualización como a su aspecto elegante. Los capítulos de esta segunda parte abordan las cuestiones más comunes que he visto surgir repetidamente en aplicaciones prácticas.

La tercera parte, "Temas varios", abarca algunas cuestiones pendientes que no cabían en las dos primeras partes. Trata de los formatos de archivo utilizados habitualmente para almacenar imágenes y gráficos, aporta ideas sobre la elección del software de visualización y explica cómo situar las cifras individuales en el contexto de un documento más amplio.

Figuras feas, malas y equivocadas

A lo largo de este libro, muestro con frecuencia diferentes versiones de las mismas figuras, algunas como ejemplos de cómo hacer una buena visualización y otras como ejemplos de cómo no hacerlo. Para proporcionar una pauta visual sencilla sobre qué ejemplos deben emularse y cuáles deben evitarse, etiqueto las figuras problemáticas como "feas", "malas" o "incorrectas"(Figura 1-1):

Feo

Una figura que tiene problemas estéticos pero que por lo demás es clara e informativa

Mal

Una figura que tiene problemas relacionados con la percepción; puede ser poco clara, confusa, demasiado complicada o engañosa

Incorrecto

Una cifra que tiene problemas relacionados con las matemáticas; es objetivamente incorrecta

fodv 0101
Figura 1-1. Ejemplos de cifras feas, malas y erróneas. (a) Un diagrama de barras que muestra tres valores (A = 3, B = 5 y C = 4). Se trata de una visualización razonable sin grandes defectos. (b) Una versión fea de la parte (a). Aunque el gráfico es técnicamente correcto, no es estéticamente agradable. Los colores son demasiado brillantes y no son útiles. La cuadrícula de fondo es demasiado prominente. El texto se muestra utilizando tres tipos de letra diferentes en tres tamaños distintos. (c) Una mala versión de la parte (a). Cada barra se muestra con su propia escala en el eje y. Como las escalas no están alineadas, la figura resulta engañosa. Se puede tener fácilmente la impresión de que los tres valores están más próximos entre sí de lo que realmente están. (d) Una versión incorrecta de la parte (a). Sin una escala explícita en el eje y, no se pueden determinar los números representados por las barras. Las barras parecen tener las longitudes 1, 3 y 2, aunque los valores mostrados sean 3, 5 y 4.

No estoy etiquetando explícitamente las figuras buenas. Cualquier figura que no esté etiquetada como defectuosa debe considerarse al menos aceptable. Es una figura que es informativa, tiene un aspecto atractivo y podría imprimirse tal cual. Ten en cuenta que entre las figuras buenas seguirá habiendo diferencias de calidad, y algunas figuras buenas serán mejores que otras.

Por lo general, justifico las valoraciones específicas, pero algunas son cuestión de gustos. En general, la calificación de "feo" es más subjetiva que la de "malo" o "incorrecto". Además, la frontera entre "feo" y "malo" es algo fluida. A veces, las malas elecciones de diseño pueden interferir en la percepción humana hasta el punto de que una calificación de "malo" sea más apropiada que una calificación de "feo". En cualquier caso, te animo a que desarrolles tu propio ojo y evalúes críticamente mis elecciones.

Get Fundamentos de la visualización de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.