Capítulo 1. Análisis Categorial

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Elanálisis categórico es la base de la visualización de datos. Es el primer y más frecuente tipo de visualización de datos que utilizan los analistas de datos. El análisis categórico toma una dimensión (por ejemplo, [Regiones]) y la divide en una medida (por ejemplo, [Ventas]). Una dimensión es normalmente un valor categórico; éstos no se agregan. Es probable que se utilicen para crear cabeceras de datos o para generar filtros. Una medida es un valor (normalmente numérico) que puede agregarse mediante funciones matemáticas (como suma, media o mediana). Las medidas crean ejes ininterrumpidos, los que se extienden de un extremo a otro de un intervalo.

Este tipo de análisis ayuda a responder a preguntas empresariales comunes como éstas:

  • ¿Cómo se compara A con B?

  • ¿Cómo se distribuye la medida X entre las categorías Y?

  • ¿Cuánto aportan A, B y C al total?

  • ¿Cómo mide X el cambio a lo largo del tiempo (donde el tiempo es la dimensión)?

Los análisis categóricos suelen presentarse en forma de gráficos de barras. Los gráficos de barras utilizan altura o longitud como codificación visual para expresar una medida. Codificación visual se refiere a las técnicas utilizadas para mostrar datos en gráficos; la Figura 1-1 muestra algunos ejemplos. La codificación de datos en gráficos de barras es eficaz porque los humanos pueden analizar rápidamente la variación entre el tamaño de las barras; también son fáciles de entender y etiquetar.

This illustration shows the various ways that data can be encoded for display, and aligns them to a comprehension scale indicating how precisely the human eye can discern differences
Figura 1-1. Esta ilustración de muestra las distintas formas en que pueden codificarse los datos para su visualización, y las alinea con una escala de comprensión que indica la precisión con que el ojo humano puede discernir las diferencias

En nuestro primer caso de uso, exploraremos cómo hacer gráficos de barras eficaces . Desempeñarás el papel de una gran institución financiera que quiere comprender qué categorías de comerciantes constituyen la mayor parte del gasto transaccional, con el fin de impulsar los esfuerzos de marketing y las asociaciones y servir mejor a los intereses de los clientes. También saldremos de los valores predeterminados y aprenderemos dos métodos adicionales para hacer gráficos de barras que muestren la información más importante.

En el segundo caso práctico, aprenderás a trabajar con muchas dimensiones. Aunque los gráficos de barras son muy útiles, necesitarás otras herramientas de visualización de datos cuando realices análisis categóricos. Cuando una dimensión tiene muchos miembros, mostrar cada uno de ellos como un gráfico de barras a veces resulta problemático. Cuando esto ocurra, puedes utilizar formas de gráfico alternativas para ahorrar espacio y seguir mostrando todos los miembros. El gráfico más útil en este caso es un mapa de árbol. Exploraremos los mapas de árbol a través de este caso práctico sobre una organización sin ánimo de lucro.

En nuestro último caso práctico de este capítulo, aprenderás a utilizar gráficos circulares y de donut para visualizar relaciones enteras. Este caso práctico consiste en realizar una encuesta sobre los profesionales informáticos y la salud mental. Los gráficos circulares suelen ser el primer tipo de visualización de datos que se aprende en la escuela, pero nos gusta utilizarlos con moderación y como opción alternativa. Cuando lleguemos a este caso práctico, verás cómo los gráficos circulares bien ejecutados pueden ser herramientas estupendas para elaborar y compartir datos con tu audiencia.

Gráficos de barras: Caso práctico del Banco de Tableau

Nuestro primer caso práctico se refiere a una gran institución financiera que intenta comprender los comportamientos de los consumidores. La llamaremos Banco de Tableau(abre viadoBoT ).

El equipo de datos de BoT trabaja para comprender cómo y dónde gastan su dinero los consumidores. Este objetivo es fundamental para el éxito de la organización porque impulsará la dirección de los esfuerzos de marketing, las asociaciones y las promociones de productos. También proporcionará información para perfilar a los clientes e incluso puede desvelar oportunidades para aumentar la población de clientes. ¿Qué tipo de gráfico debe utilizar el equipo para presentar sus resultados?

Gráficos de barras debe ser el primer tipo de visualización que pruebes cuando explores el análisis categórico. Como utilizan la longitud y la altura como codificación visual, facilitan la interpretación y la comparación de los miembros.

Para resolver el problema del equipo de datos bancarios, vas a empezar con un gráfico de barras básico. Te ayudará a comparar los tipos de comercios según lo que gastan los consumidores. También servirá como primer paso para comprender los datos.

Estrategia: Construir un gráfico de barras en Tableau

Para construir tu primer gráfico de barras, utilizarás el conjunto de datos Transacciones de instituciones financieras mientras sigues con Tableau. Estos son los pasos:

  1. Arrastra la dimensión [Tipo de comerciante] a la estantería Filas.

  2. Arrastra la medida [Importe de la transacción] al estante Columnas como SUM([Transaction Amount]).

  3. En la barra de herramientas, ordena los comerciantes en orden descendente por Importe de la transacción (también conocido como gasto).

Enhorabuena: has construido tu primer gráfico de barras. Puede que no parezca revolucionario, pero es el primer paso para averiguar dónde se centra el gasto de los consumidores. Este sencillo gráfico, que se muestra en la Figura 1-2, disipa cualquier teoría basada en la intuición y nos presenta los hechos.

A bar chart showing the merchant categories sorted in descending order by transaction amount
Figura 1-2. Un gráfico de barras que muestra las categorías de comerciantes ordenadas en orden descendente por el importe de la transacción

Este es un buen punto de partida. Ahora hemos visualizado los datos y podemos ver que la mayor categoría de comerciantes es la de Tiendas de Ropa de Hombre y Mujer. También podemos ver que varias categorías de comerciantes pequeñas no son responsables de mucho gasto, como Limpieza y Mantenimiento. Saber que hay muchos tipos de categorías de comerciantes, y que algunas son mucho mayores que otras, es una información adicional sobre la que podemos actuar para mejorar nuestra visualización.

Una buena forma incremental de hacerlo es limitar el número de categorías de comerciantes visibles utilizando un filtro Top N con un parámetro. Este filtro limita el gráfico en N, el número definido, para mostrar sólo los miembros superiores en el gráfico. Un parámetro es un campo de entrada dinámico definido por el usuario final.

En este escenario, crearemos un parámetro que permita al usuario definir dinámicamente el número de categorías que desea ver. Añadir el parámetro no sólo da a nuestro público más control sobre la visualización, sino que también proporciona una forma más conversacional de entender el contenido del gráfico. Una ilustración del Top 10 es mucho más tangible que una larga lista de barras de.

Consejo

En la próxima estrategia, trabajarás por primera vez con un parámetro. Utilizaremos la nemotecnia ABC para recordar los pasos más habituales para construir un parámetro:

  • R: Añade un nuevo parámetro.

  • B: Trae el control de parámetros a tu hoja de cálculo (muestra el control).

  • C: Incluir el parámetro en un campo calculado.

Estrategia: Crear un Gráfico de Barras Top N

Para crear el gráfico de barras Top N, sigue estos pasos:

  1. Arrastra [Tipo de comerciante] al estante Filtros.

  2. Navega hasta la sección Superior.

  3. En la lista desplegable, selecciona Crear un nuevo parámetro.

  4. Ponle un nombre al parámetro [Top N] y guárdalo.

  5. Haz clic con el botón derecho del ratón en el parámetro, en la parte inferior izquierda del panel Datos, para exponer el control del parámetro.

Observa en la Figura 1-3 que hemos puesto el valor del parámetro en el título del gráfico. Ahora, cuando el usuario realice un cambio dinámico, el número se actualizará en respuesta. Con este pequeño acto, hemos creado una cartera de gráficos que pueden personalizarse para adaptarse a las necesidades del público. El cambio también hace que el gráfico responda a la audiencia; sus acciones cambian la visualización.

A bar chart with Top N filtering and a parameter applied
Figura 1-3. Un gráfico de barras con el filtrado Top N y un parámetro aplicado

¿Cómo podemos ir un paso más allá? Suponemos que te has preguntado qué porcentaje del total representa cada una de estas categorías. Aunque compararlas es útil mientras tratamos de sintetizar más nuestro pensamiento, una inclinación natural sería cambiar el comentario de que "Las tiendas de ropa de hombre y mujer representan 27 millones de dólares en gasto de los clientes" por "Cerca del 4% de todo el gasto de los clientes se atribuye a las tiendas de ropa de hombre y mujer".

¿Cómo planteamos la presentación de esta información? Bueno, en primer lugar, podemos cambiar la medida de una medida directa a un porcentaje del total. Pero ahora nos queda la duda de que si limitamos nuestro gráfico a un Top 10, perderemos el contexto de cuánto se gasta en todas las demás categorías.

Para evitar esta limitación, podemos permitir que el público utilice un parámetro para definir la proporción del gasto del cliente que quiere ver desglosado en las categorías de comerciantes, y agrupar automáticamente todas las demás categorías. Siguen teniendo control dinámico sobre el gráfico, pero se quedan con una imagen completa de los datos, como se muestra en la Figura 1-4.

Fíjate en que tendrás que construir un cálculo que sea equivalente al cálculo del porcentaje del total que hiciste. Para ello, puedes utilizar expresiones de nivel de detalle(LOD). Una expresión LOD te permite definir la agregación del cálculo, independientemente de las dimensiones utilizadas en la visualización. Este cálculo toma el SUM([Transaction Amount]) y lo divide por el SUM([Transaction Amount]) total de todo el conjunto de datos.

The updated bar chart, now with All Other Categories grouped at the bottom
Figura 1-4. El gráfico de barras actualizado de , ahora con Todas las demás categorías agrupadas en la parte inferior

Estrategia: Agrupar dinámicamente otras dimensiones

Para actualizar nuestro gráfico para agrupar dinámicamente otras dimensiones y mostrar el porcentaje del total, sigue estos pasos, utilizando la hoja de cálculo de la estrategia anterior:

  1. Elimina el filtro [Categoría de vendedor] de la estantería Filtros haciendo clic con el botón derecho del ratón y seleccionando "Eliminar" o arrastrándolo al espacio gris situado bajo la tarjeta Marcas.

  2. Cambia la medida a un porcentaje del total utilizando los Cálculos Rápidos de Tabla. Haz clic con el botón derecho del ratón en SUM([Transaction Amount]) y elige Cálculos Rápidos de Tabla → Porcentaje del Total.

  3. Crea un parámetro llamado [Percentage Threshold]. Establece el tipo de datos como flotante con 0,01 como valor actual. Muestra el formato del número como porcentaje.

  4. Crea un conjunto basado en la dimensión [Tipo de comerciante]. Será un conjunto de fórmulas basado en el cálculo de que el porcentaje del total es mayor o igual que el parámetro. Haz clic con el botón derecho del ratón en [Tipo de comerciante] en el panel Datos y selecciona Crear → Conjunto.

  5. En el cuadro de diálogo Crear conjunto, selecciona "Utilizar todo" y, a continuación, ve a la pestaña Condición e introduce lo siguiente en el cuadro de texto "Por fórmula":

    SUM([Transaction Amount])/MAX({SUM([Transaction Amount])})
    	>= [Percentage Threshold]
  6. Crea una dimensión calculada llamada [Merchant Category to Display]:

    //Merchant Category to Display
    IF [Merchant Category Set] THEN [Merchant Category]
    ELSE "All Other Categories" END
  7. Arrastra la nueva dimensión [Tipo de comerciante a mostrar] encima de [Tipo de comerciante] en el estante Filas.

  8. Arrastra [Conjunto de categorías comerciales] a la izquierda de [Categoría comercial a mostrar]. Esto organizará la forma en que se listan las categorías. Haz clic con el botón derecho del ratón y oculta la cabecera.

  9. Termina la visualización haciendo clic con el botón derecho y añadiendo el parámetro [Umbral porcentual] a la hoja. Haz también clic con el botón derecho del ratón y oculta la cabecera del campo [Categoría de vendedor a visualizar]. Añade etiquetas haciendo clic en Etiqueta en la ficha Marcas y seleccionando la casilla "Mostrar etiquetas de marcas".

El análisis actualizado es mucho más flexible a las preferencias del público. Ahora disponen de información contextual sobre el porcentaje del total, y de información para determinar cuántos datos se muestran. Esta visualización está un paso por delante del gráfico de barras con la suma del gasto, porque ya no sacrificamos conocer la distribución total de los datos.

Si has llegado a este punto y aún quieres más, puedes introducir elementos adicionales para añadir aún más contexto y retroalimentación. De forma similar a nuestro parámetro original para el Top N, estas técnicas adicionales proporcionarán información a la audiencia a medida que el gráfico reaccione a sus aportaciones, y contribuirán a aumentar su confianza en el gráfico .

Estrategia: Mejora tu gráfico de barras con colores

Un añadido que puedes hacer a tu gráfico de barras en es el color. Sigue estos pasos para esta mejora:

  1. Puedes utilizar el parámetro como línea de referencia para reforzar el concepto de entrada dinámica. Haz clic con el botón derecho del ratón en el eje [% del Importe Total de la Transacción] y selecciona Añadir Línea de Referencia. Establece el Alcance en Toda la Tabla, el Valor en Umbral Porcentual y la Etiqueta en Valor. Haz clic en Aceptar.

  2. Ahora ajusta el Umbral porcentual a 0,75% (0,0075). Observa que aparecen categorías adicionales, pero ninguna es inferior al 0,75%.

  3. También puedes codificar aún más las grandes categorías comerciales objetivo utilizando nuestro conjunto para el color. Arrastra [Conjunto de categorías de comerciantes] a Color. Los comerciantes del conjunto aparecerán en un color, mientras que los que no estén en él y formen parte de "Todas las demás categorías" aparecerán en otro color.

    La Figura 1-5 muestra el resultado.

The same bar chart, now with color encoding to distinguish between the individual categories and the grouped category
Figura 1-5. El mismo gráfico de barras, ahora con codificación de colores para distinguir entre las categorías individuales y la categoría agrupada

¡Bien hecho! Nos encantan los gráficos de barras: son herramientas fundamentales para cualquier análisis. Aunque pueden empezar siendo muy sencillos, puedes llevar un gráfico de barras de lo básico a lo asombroso mediante métricas abstraídas y entradas dinámicas.

A veces el valor está en la forma en que formateas el texto sobre y alrededor de esos gráficos de barras. En esta sección, hablaremos de otras tres formas de animar tus gráficos de barras con un formato que los haga resaltar. Seguirás utilizando el conjunto de datos Transacciones de Instituciones Financieras para construir estos.

Estrategia: Alinear el texto a la izquierda

Comenzando con una nueva hoja de cálculo, utilizarás Red para crear este gráfico de barras con formato:

  1. Añade [Red] al estante Filas y SUM([Transactions]) al estante Columnas. Configura la vista como Vista Completa y utiliza el icono de ordenación del eje para ordenar las redes en orden descendente por SUM([Transactions]).

  2. Añade [Red] y SUM([Transactions]) a Etiqueta en la ficha Marcas manteniendo pulsada la tecla Ctrl y arrastrando cada una de ellas desde su respectivo estante Filas/Columnas.

  3. Haz clic con el botón derecho del ratón en [Red] en la estantería Filas y desmarca Mostrar encabezado.

  4. Para editar la etiqueta, haz clic en Etiqueta en la ficha Marcas. En el cuadro de diálogo que se abre, haz clic en la elipsis situada junto a la opción Texto. Personaliza la etiqueta para que se lea <Network> // <SUM(Transactions)> y que esté alineada a la izquierda. Te recomendamos que configures el tamaño de la fuente de la dimensión para que sea aproximadamente 1,5 veces mayor que la fuente de la medida. Para ello, establece <Red> en 12 y <SUMA(Transacciones)> en 10.

  5. Haz clic de nuevo en Etiqueta y ajusta la alineación horizontal a Izquierda.

  6. Haz clic con el botón derecho del ratón en el eje y anula la selección de Mostrar cabecera para ocultar el eje de [Transacciones].

  7. En la barra de herramientas, elige Formato → Líneas. Elimina las líneas de la cuadrícula y las líneas cero poniéndolas a Ninguno. Establece las reglas de eje de las filas en negro sólido.

El resultado es una visualización con etiquetas que contienen el nombre de la dimensión y el valor asociado a la medida(Figura 1-6).

Reformatting a bar chart can bring new life to the chart type
Figura 1-6. Reformatear un gráfico de barras puede dar nueva vida al tipo de gráfico

Estrategia: Crear barras con etiquetas en la parte superior

Esta estrategia también coloca las etiquetas y los valores directamente encima de las barras. El truco para crear este gráfico de barras es que no vamos a utilizar en absoluto el tipo de marca Barra:

  1. Haz clic con el botón derecho en la hoja de cálculo de la estrategia anterior y duplícala.

  2. Crea un cálculo llamado [Baseline]. Este cálculo se utilizará para establecer la ubicación base de los gráficos de barras:

    //Baseline
    MIN(0.0)
  3. Añade [Línea de base] al estante Columnas. Haz clic con el botón derecho del ratón y crea un eje doble. Sincroniza el eje y luego cambia el tipo de marca a Gantt. Oculta el eje haciendo clic con el botón derecho y deseleccionando Mostrar cabecera. Puede que tengas que volver a cambiar el tipo de marca de SUM([Transactions]) a Barra. Mientras lo haces, desmarca también "Mostrar etiquetas de marca".

  4. En la ficha Marcas de [Línea de base], edita la anchura del diagrama de Gantt haciendo clic en Tamaño y ajustando el deslizador para que las barras de Gantt sean lo más anchas posible. Cambia el color a blanco y ajusta la opacidad a cero.

  5. Ajusta la alineación de la etiqueta para que esté justificada a la derecha horizontalmente y en la parte superior verticalmente.

  6. Ahora puedes ajustar el tamaño de la barra SUM([Transactions]) para que sea más pequeña, dando la apariencia de que las etiquetas de la marca Gantt están encima de la barra. La Figura 1-7 muestra el gráfico reformateado.

Another reformatted bar chart
Figura 1-7. Otro gráfico de barras reformateado

Estrategia: Crear un diagrama de barras de porcentaje del máximo

Para este ejemplo, construirás otro gráfico de barras(Figura 1-8), pero esta vez el fondo de la barra también se resaltará con color:

  1. Crea un cálculo llamado [Total Bar]:

    // Total Bar
    MIN(1.0)
    Consejo

    Vamos a utilizar este cálculo para representar el 100% del importe de la transacción dentro de la visualización.

  2. Añade [Red] a la estantería Filas.

  3. Añade [Barra Total] al estante Columnas. Fija el eje para que empiece en 0 y termine en 1,1. Puedes hacerlo haciendo clic con el botón derecho en el eje y seleccionando Editar Eje. En el cuadro de diálogo, establece el Rango como Fijo y utiliza 0 como inicio fijo y 1,1 como final fijo.

  4. Establece la opacidad del color en 40%. Arrastra SUM([Transactions]) hasta Etiqueta.

  5. Crea una medida llamada [Percent of Maximum]:

    // Percent of Maximum Transactions
    SUM([Transactions])/WINDOW_MAX(SUM([Transactions]))
  6. Añade esta nueva medida a la estantería Columnas. Crea un eje doble y sincroniza los ejes. Puede que tengas que volver a cambiar los tipos de marca a Barra. Elimina [Nombres de Medidas] de Color en todas las tarjetas de Marcas. Elimina la etiqueta de la tarjeta de Marcas [Porcentaje de Transacciones Máximas].

  7. Ordena las redes haciendo clic en el eje y seleccionando orden descendente. A continuación, oculta las dos cabeceras de los ejes. Ajusta el tamaño de los gráficos de barras para que estén en la marca central de Tamaño.

A percent-of-maximum bar chart
Figura 1-8. Gráfico de barras de un porcentaje del máximo

Gráficos Barra sobre Barra: Estudio de caso de Amplify Performance

Nuestro siguiente estudio de caso examina una organización sin ánimo de lucro, Amplify Performance (AP), que controla y concede dinero de subvenciones para programas e iniciativas de artes creativas, escénicas y culturales para el estado de Nueva York. El dinero de las subvenciones se divide en dos tipos de categorías: una está relacionada con el presupuesto de la organización y la otra clasifica más directamente las iniciativas de los programas. El equipo de datos de AP intentó mostrar ambos tipos con gráficos de barras uno al lado del otro, pero los resultados eran confusos. ¿Qué tipo de visualización funcionaría mejor?

No todas las comparaciones categóricas van a requerir un simple gráfico de barras. A veces las comparaciones son más complejas. Por ejemplo, puede que tengas que comparar grupos en una única métrica, pero a lo largo de dos periodos de tiempo diferentes. Tu audiencia querrá entender los cambios entre los miembros, pero también cómo han cambiado los grupos individuales a lo largo del tiempo.

El primer instinto de los desarrolladores novatos en estas situaciones suele ser utilizar un gráfico de barras paralelas. Pueden ser eficaces, pero ocupan mucho espacio. Al hacer este tipo de análisis, preferimos utilizar un gráfico de barras. En la Figura 1-9, puedes ver los tamaños totales de las subvenciones de 2018 y 2019 para cada categoría en un gráfico de barras paralelas.

Side-by-side bar charts are effective but take up too much space
Figura 1-9. Los gráficos de barras paralelos son eficaces pero ocupan demasiado espacio

En parece que tienes toda la información que realmente quieres: hay barras para dos años, y puedes comparar rápidamente. Pero te darás cuenta de que los datos no están ordenados por el total de 2019, sino por el total de los dos años.

Además, cualquier comparación que hagamos dentro de un grupo (por ejemplo, Educación Artística) requiere que el público haga cuentas mentales para comprender la magnitud del cambio de 2018 a 2019. Sería estupendo disponer de esa información directamente en la visualización. También sería útil que el público pudiera observar rápidamente qué categorías aumentaron respecto al año anterior y cuáles disminuyeron.

Puedes hacer todo esto utilizando un gráfico de barras sobre barras, como se muestra en la Figura 1-10. Sigue el ejemplo para crearlo utilizando el conjunto de datos Datos de Subvenciones sin Ánimo de Lucro.

A bar-on-bar chart is a better alternative to the side-by-side bar chart because it takes up less space while displaying the same information
Figura 1-10. Un gráfico de barras sobre barras es una alternativa mejor que el gráfico de barras de lado a lado, porque ocupa menos espacio mostrando la misma información

Estrategia: Crear un gráfico barra sobre barra

En la Figura 1-10, hemos colocado los totales de subvención de 2019 sobre los totales de subvención de 2018 para cada categoría. Aquí, tu público puede seguir comparando rápidamente los grupos del año base, en este caso 2019, así como los resultados de ese grupo respecto al año anterior.

Ayudamos a la comparación interanual añadiendo color: no elegimos dos colores distintos, sino dos colores con la misma tonalidad. Los totales que disminuyeron respecto al año anterior se representan con una versión más brillante y menos saturada del color utilizado para indicar los totales que aumentaron respecto al año anterior.

Por último, añadimos el cambio interanual como porcentaje junto al total de 2019. El resultado en la Figura 1-10 es un gráfico que consolida tres comparaciones: el total de dólares de subvención en todos los grupos para 2019, los cambios en el total de dólares de subvención de 2018 a 2019 para cada grupo, y los cambios en la magnitud de 2018 a 2019.

¿Cómo se crea este gráfico? Sigue estos pasos:

  1. Crea tus medidas. En lugar de utilizar una dimensión de fecha para dividir tus datos, es más eficaz crear dos cálculos separados que filtren a los datos relevantes dentro del cálculo. Creemos un cálculo para los importes de las subvenciones en 2018:

    // Grant Amount | 2018
    SUM(
     IF YEAR([Date]) = 2018
     THEN [Grant Amount]
     END
    )

    Y un cálculo de los importes de las subvenciones en 2019:

    // Grant Amount | 2019
    SUM(
     IF YEAR([Date]) = 2019
     THEN [Grant Amount]
     END
    )

    En general, evita codificar nada dentro de los cálculos. En este caso, normalmente utilizaríamos cálculos o parámetros para automatizar el cambio a medida que se actualizan los datos. (Hablaremos más de esto en el Capítulo 4.)

  2. Crea la visualización base añadiendo [Categoría Presupuestaria] a las Filas y tanto [Importe Subvención | 2018] como [Importe Subvención | 2019] a las Filas.

    1. Crea un gráfico sincronizado de doble eje con ambos tipos de marca como Barras. Asegúrate de colocar 2018 como la dimensión situada más a la izquierda en el eje dual.

      Cambia el tamaño de las barras de 2019 para que sean más estrechas que las de 2018. Puede que tengas que ajustar ambos para que tus barras estén en un lugar feliz.

    2. Asegúrate de eliminar [Nombres de las Medidas] de ambas tarjetas de Marcas. (No has añadido esto; Tableau lo hizo automáticamente cuando creaste un gráfico de dos ejes).

    3. Establece el color de la barra exterior en un gris claro que aún se distinga del fondo, como se muestra en la Figura 1-11.

    Use a dual axis with custom calculations to create bar-on-bar charts
    Figura 1-11. Utiliza un eje doble con cálculos personalizados para crear gráficos barra sobre barra
    Consejo

    Preferimos que la anchura de nuestras barras exteriores (en la Figura 1-11, 2018) sea igual a la anchura del espacio en blanco entre barras. Para nuestras barras interiores, buscamos que la anchura esté entre el 50% y el 75% de la anchura de las barras exteriores.

  3. Podríamos basarnos en los ejes para las comparaciones, pero como estamos utilizando un gráfico de barras horizontales, tiene sentido añadir etiquetas:

    1. En la tarjeta de Marcas [Importe de la subvención | 2019], haz clic y arrastra [Importe de la subvención | 2019] a Etiquetas.

    2. Crea un nuevo cálculo llamado [Grant Amount | % Change] para el cambio porcentual de 2018 a 2019:

      // Grant Amount | % Change
      ([Grant Amount | 2019] - [Grant Amount | 2018]) / [Grant Amount | 2018]
    3. Después de crear la medida, haz clic con el botón derecho en ella y cambia la configuración por defecto del formato numérico, como se muestra en la Figura 1-12.

      Use custom formatting to get your percentage displays just right
      Figura 1-12. Utiliza un formato personalizado para que la visualización de tus porcentajes sea la correcta

      Esto mostrará un signo más delante de los valores positivos, un signo menos delante de los valores negativos y ningún signo cuando no haya cambios en la dirección.

    4. Añade también este cálculo a la Etiqueta. Ahora edita el texto de la etiqueta. Da formato a [Importe de la subvención | 2019] para que sea más grande y de un tono más oscuro que la medida [Importe de la subvención | % de cambio]. Tu gráfico debería parecerse a la Figura 1-13.

      The text editor showing how you should format the text labels on the visualization
      Figura 1-13. El editor de texto muestra cómo debes formatear las etiquetas de texto de la visualización

      Para este ejemplo, utilizaremos fuentes de tamaño 15 y 9, respectivamente. Los colores del texto son #000000 (negro) y #555555 (gris oscuro), respectivamente. Además, hemos añadido [Importe de la subvención | % de cambio] entre paréntesis. Tu gráfico debería parecerse a la Figura 1-14.

      A look at the bar-on-bar chart before we finalize formatting
      Figura 1-14. Un vistazo al gráfico barra sobre barra antes de finalizar el formateo
  4. Para añadir color, crea una booleana simple llamada [Color] que compare 2019 con 2018 y luego añádelo a la tarjeta de Marcas [Importe de la subvención | 2019]:

    // Color
    
    [Grant Amount | 2019] > [Grant Amount | 2018]

    Puedes editar el color y seleccionar dos colores que empiecen por el mismo color: por ejemplo, el color hexadecimal base #19626B para valores que sean Verdadero y un segundo color, #84B6BC, que sea más brillante y menos saturado.

  5. Añade toques finales:

    1. Ordena tus categorías por importes totales de subvención en 2019.

    2. Oculta las etiquetas de los ejes y de las cabeceras de fila. Elimina todas las líneas adicionales.

    3. Quita el separador vertical. Conserva tu divisor horizontal, pero asegúrate de que separa cada miembro.

    El resultado debe parecerse a la Figura 1-15.

The bar-on-bar chart after adding color
Figura 1-15. El gráfico de barras sobre barras después de añadir el color

Treemaps: Estudio de caso de Amplify Performance

Un mapa de árbol es similar a un gráfico de barras, pero utiliza el área de un rectángulo en relación con la altura o longitud para codificar los datos. Si tienes muchos miembros de una dimensión y debes mostrarlos todos, un mapa de árbol es una gran alternativa a un gráfico de barras.

El área es una medida menos precisa, pero a menudo, cuando se trabaja con mapas de árbol, el objetivo no es ser completamente preciso, sino mostrar todos los miembros de una categoría en una visualización única y compacta, ordenada de mayor a menor.

Una de las principales ventajas que exploraremos con los mapas de árbol es poder utilizar el color para representar una medida o una dimensión. En el ejemplo con un mapa de árbol perforable, utilizaremos el color para representar tanto las categorías presupuestarias como las categorías de programa dentro de ellas. A continuación, mostraremos cómo mostrar a la audiencia otros miembros detallados bajo demanda. Con esta función, el público es libre de explorar múltiples facetas sin sentirse abrumado. También representaremos el color como medida, tanto directa como indirectamente.

A continuación, nos centraremos en qué hacer cuando necesites mostrar todos los miembros de una dimensión en una única visualización. Ya has visto el problema del largo desplazamiento al utilizar un gráfico de barras, así que ¿qué tipo de gráfico puedes emplear para sortear esta barrera?

Imagina que trabajas con la organización sin ánimo de lucro presentada anteriormente, AP, que controla y concede subvenciones para programas e iniciativas de artes creativas, escénicas y culturales del estado de Nueva York. El dinero de las subvenciones se divide en dos tipos de categorías: una centrada en el presupuesto de la organización y otra en las iniciativas de los programas.

En este escenario, no puedes sacrificar a los miembros pequeños. Tener visibilidad de algunas de las categorías más pequeñas es crucial, para poder saber adónde debe ir el dinero adicional de las subvenciones.

Si te enfrentas a un escenario similar, te recomendamos un mapa de árbol. Aunque perderás algo de precisión al comparar la medida elegida, obtendrás una visualización bien ordenada y compacta que mostrará todos los miembros de tu dimensión.

Estrategia: Crear un mapa de árbol básico

Crea una nueva hoja de cálculo utilizando el conjunto de datos Subvención sin ánimo de lucro y sigue estos pasos:

  1. Arrastra [Categoría presupuestaria] a Texto.

  2. Arrastra SUM([Grant Amount]) a Tamaño, y Ctrl-arrastrarlo también a Color.

  3. Asegúrate de que el tipo de marca está ajustado a Cuadrado.

    El resultado se muestra en la Figura 1-16.

A treemap showing the budget categories ordered by grant amount
Figura 1-16. Un mapa de árbol que muestra las categorías presupuestarias ordenadas por importe de subvención

Esto te dará una idea completa de cómo se distribuyen las subvenciones de AP. Ninguna categoría presupuestaria tiene una mayoría significativa de financiación, pero algunas categorías más pequeñas ocupan menos del 1%.

Consejo

La convención estándar de cuando se trabaja con mapas de árbol es codificar doblemente una medida utilizando el tamaño y el color. Esto ayuda a distinguir mejor las piezas y los miembros. Pero no es un requisito. Como alternativa, puedes considerar codificar las categorías en color. Sin embargo, recomendamos precaución: hay muchos miembros y, en este caso, estarías codificando información redundante.

Este mapa de árbol es un gran comienzo, pero sólo nos lleva a la mitad del camino para proporcionar datos concretos sobre las subvenciones. Los dólares no sólo se dividen entre presupuestos, sino que también se asignan a categorías de programas. Hay 55 categorías de programa únicas, un importante nivel adicional de detalle que podría resultar abrumador. En realidad, sólo necesitamos saber a qué categorías de programa están vinculados los dólares del presupuesto dentro de una categoría presupuestaria determinada cada vez.

Para resolver la cuestión de las categorías de programas dentro de los presupuestos, el equipo de AP puede crear un mapa de árbol perforable: un mapa de árbol interactivo en el que el público puede hacer clic en una categoría presupuestaria concreta para ver más información.

Nota

En la siguiente estrategia de , vas a utilizar acciones de conjunto. Los conjuntos y las acciones de conjunto permiten a tus usuarios finales interactuar con las visualizaciones para asignar dimensiones a un conjunto. Aquí, una vez que una dimensión forma parte de un conjunto, se mostrarán más detalles en la sección perforada.

Estrategia: Crear mapas de árbol perforables

Vamos a intentar crear un mapa de árbol perforable, siguiendo utilizando el conjunto de datos Datos de Subvenciones sin Ánimo de Lucro:

  1. Partiendo del mapa de árbol terminado de la estrategia anterior, crea un conjunto basado tanto en [Categoría de presupuesto] como en [Categoría de programa] arrastrando primero [Categoría de programa] a la tarjeta Marcas de la vista del mapa de árbol. Esto te permitirá hacer clic en una marca y crear un conjunto que combine ambas dimensiones. Haz clic con el botón derecho en cualquier marca y crea un conjunto llamado [Program & Budget Set]. No importa qué valores haya en el conjunto inicialmente, sólo que haya dos columnas, una para cada dimensión.

  2. Ahora crea un campo calculado llamado [Label Program]. Esto evaluará si algo forma parte del conjunto y devolverá el programa en caso afirmativo:

    //Label Program
    IF [Program & Budget Set] THEN [Program Category] END
  3. Arrastra este campo calculado encima de [Categoría de programa] en la ficha Marcas.

  4. Crea la funcionalidad de desglose. Elige Hoja de cálculo → Acciones → Añadir acción → Cambiar valores de conjunto.

  5. Llámalo Drill Down to Program. Se ejecutará en Seleccionar. El Conjunto de destino es [Conjunto de Programas y Presupuestos]. La acción que quieres al borrar la selección es "Eliminar todos los valores del conjunto".

  6. Arrastra [Categoría Presupuestaria] sobre Color, sustituyendo a SUM([Grant Amount]).

  7. Ahora haz clic en Danza, y el rectángulo del mapa de árbol se perforará para mostrar todos los programas que componen el presupuesto de Danza.

Observa en la Figura 1-17 que aquí has cambiado la forma de aprovechar el color. En lugar de vincular el color a la repetición del gasto en subvenciones, lo utilizas para distinguir las categorías presupuestarias.

A treemap showing both the budget category and program category (the treemap is colored by budget category, and the size of the rectangle represents the grant amount)
Figura 1-17. Un mapa de árbol que muestra tanto la categoría presupuestaria como la categoría de programa (el mapa de árbol está coloreado por categoría presupuestaria, y el tamaño del rectángulo representa el importe de la subvención)

Volvamos a nuestro ejemplo del mapa de árbol una vez más, y llevemos la codificación de colores en una dirección más. En este escenario, vas a empezar con categorías de programas para crear el mapa de árbol. Esta vez, el equipo de AP intenta asegurarse no sólo de que los distintos tipos de programas reciben una distribución suficiente de la financiación, sino también de que existe diversidad en los tipos de programas que se financian y apoyan.

Estrategia: Codificar una medida continua con colores

Para esta visualización, utilizarás la codificación por colores para detectar oportunidades de revitalización de los programas. También lo utilizarás para destacar otra medida continua: los días transcurridos desde que se financió la subvención más reciente.

Una medida continua es una que abarca un intervalo infinito, normalmente en una recta numérica o una línea de tiempo:

  1. En una nueva hoja de cálculo, crea un mapa de árbol de [Categoría de programa] e [Importe de la subvención].

  2. Crea un campo calculado que evalúe cuánto tiempo ha pasado desde que se concedió una subvención en una categoría:

    //Days Since Last Grant
    DATEDIFF( 'day',MAX([Date]),TODAY())
  3. Cuando utilices este cálculo en la vista, evaluará la fecha máxima o más reciente por [Categoría de programa] y luego calculará el número de días desde hoy.

  4. Pon esta medida en Color y cambia la Paleta a Secuencial azul-verde invertido.

    Puedes ver el resultado en la Figura 1-18.

A treemap showing grant amount by program category; color has been encoded to show the number of days since the program was last funded
Figura 1-18. Un mapa de árbol que muestra el importe de la subvención por categoría de programa; se ha codificado el color para mostrar el número de días transcurridos desde la última financiación del programa

Ya has visto tres enfoques de los mapas de árbol, que utilizan diferentes técnicas de codificación por colores y elementos dinámicos que permiten al público indagar en una categoría y explorarla con mayor profundidad .

Gráficos de tarta y rosquilla: Caso práctico de un proyecto informático de bienestar de los empleados

Nuestro último estudio de caso de este capítulo se refiere al Proyecto de Bienestar de los Empleados de TI, una iniciativa que realiza encuestas a profesionales de TI y a sus empleadores. El proyecto investiga cómo afecta el trabajo de TI a la salud mental de los empleados, así como las actitudes de los empresarios respecto a la salud mental.

Como en la mayoría de las encuestas, hay muchas preguntas que analizar para determinar las actitudes, pero una tarea fundamental es proporcionar una visión demográfica de los encuestados. El objetivo de los analistas de datos del proyecto es mostrar la distribución por sexos entre los encuestados por profesión. También les gustaría comparar esa distribución entre varias profesiones al mismo tiempo. ¿Qué tipos de gráficos les ayudarían a transmitir esto con mayor eficacia a los miembros de la junta del proyecto?

Cuando analices una relación entre partes y el todo, un lugar natural para empezar es un gráfico circular . Un gráfico circular divide un círculo en trozos por miembros de una dimensión, y cada trozo representa una proporción del todo. Algunos amantes de los gráficos se acobardan al pensar en un gráfico circular, pero los gráficos circulares resultan familiares a la mayoría de la gente. Además, utilizan el espacio de forma eficiente y pueden servir como leyendas de colores o filtros interactivos. No son la mejor opción en todas las situaciones, pero tienen su lugar cuando se utilizan correctamente.

En nuestra estrategia final del capítulo, llevarás tus gráficos de donuts un paso más allá: haciendo pequeños múltiplos, o versiones repetidas del mismo gráfico, separadas por profesión. Esto permitirá al equipo de datos comparar la distribución por sexos entre varias profesiones al mismo tiempo.

Estrategia: Construye un gráfico circular básico

Vamos a empezar con el gráfico circular básico. Utilizarás el conjunto de datos Datos de la Encuesta Informática para seguir:

  1. Arrastra [Sexo] sobre Color.

  2. Cambia el tipo de marca a Pastel.

  3. Crea un campo calculado llamado [# Respondents].

    //# Respondents
    COUNTD([Respondent ID])
  4. Arrastra [# Encuestados] sobre Ángulo. Cambia los colores a tu elección (estamos utilizando la paleta Verano y un borde blanco). Arrastra [Sexo] a Etiqueta junto con [# Encuestados]. Da formato a la etiqueta para que coincida con los colores de la marca.

    La Figura 1-19 muestra el resultado.

A pie chart showing the distribution of gender for survey respondents
Figura 1-19. Gráfico circular que muestra la distribución por sexos de los encuestados

¿Por qué funciona este gráfico circular? En primer lugar, sólo tiene tres trozos; este pastel no tiene muchos trozos, así que es bastante fácil comparar las diferencias. Además, has hecho un esfuerzo adicional para etiquetar directamente y poner el porcentaje junto a cada trozo. Esto facilita la comprensión del público. Si tuvieras muchos más valores, o varias rebanadas de relativamente el mismo tamaño, nuestra recomendación sería un gráfico de barras, pero aquí claramente no es el caso .

Estrategia: Construye un gráfico de donuts

Ahora vamos a convertir este gráfico circular en un gráfico de rosquilla añadiéndole un agujero en el centro. Este agujero te permite comunicar un dato adicional. En este caso, te permite representar dos conceptos en un solo gráfico: el número de encuestados y la distribución por sexos:

  1. Crea una medida ficticia [MIN(1)]ya que se utilizará como medida múltiple en un gráfico de dos ejes:

    //Dummy
    MIN(1)
  2. Arrástralo a Filas dos veces, haz clic con el botón derecho y crea un gráfico de dos ejes. Puedes utilizar la visualización de la estrategia anterior como punto de partida.

  3. Haz que la talla de la primera medida sea la correcta en la talla recomendada.

  4. Haz clic con el botón derecho del ratón en [# Encuestados] y cámbialo a un Cálculo Rápido de Porcentaje de la Tabla Total. A continuación, formatea el porcentaje para que no tenga decimales haciendo clic con el botón derecho en el campo y seleccionando Formato.

  5. Haz clic en la segunda medida y elimina todos los campos, excepto [# Encuestados], que debe estar en Etiqueta. Añade el texto Respondents en fuente de 8 pt. debajo del campo.

  6. Haz que el tamaño de la segunda medida sea la marca izquierda del tamaño recomendado.

  7. Alinea la etiqueta en el medio y en el centro, y establece el color de la marca en blanco.

  8. Oculta los ejes y elimina todas las líneas del gráfico.

    Puedes ver el resultado en la Figura 1-20.

A donut chart with the number of respondents has been added to the center; the slices represent the distribution of survey respondents by gender
Figura 1-20. Se ha añadido en el centro un gráfico de donuts con el número de encuestados; las rodajas representan la distribución de los encuestados por sexo

Ahora tienes un gráfico de donuts que sirve para dos propósitos y es fantástico para generar descripciones perspicaces. Puedes decir "el 24% de los encuestados eran mujeres" e inmediatamente sabrás el tamaño de la muestra de la encuesta, que será necesario para que la audiencia tome decisiones a partir de los resultados.

Para completar el gráfico de donuts, podrías utilizarlo como un filtro interactivo; cuando un usuario hace clic en una rebanada, Tableau filtra en visualizaciones posteriores. También podría servir como leyenda de color, que haga algo más que decir que el verde significa masculino.

Estrategia: Crear múltiplos pequeños

Puesto que en estamos trabajando con gráficos de postre, hay una última visualización que nos gustaría presentar: el pequeño múltiplo, que es cualquier gráfico repetido varias veces en un formato más pequeño. Con los gráficos de tartas y rosquillas, los múltiplos pequeños se vuelven bastante potentes. Puedes tomar una dimensión con más miembros y utilizarla para crear gráficos repetidos para comparaciones.

Sabemos que la junta del proyecto quiere ver cómo cambia la distribución por sexos entre las profesiones. Los múltiplos pequeños pueden ayudarte a separar la respuesta rápidamente. Sí, podrías crear un filtro para seleccionar la función, pero obtendrás más información de un vistazo cuando crees múltiplos pequeños que puedan mostrar la distribución y sigan proporcionando el tamaño de la muestra en contexto.

Partiendo del gráfico de donuts que acabas de hacer, sólo tienes que hacer unos pocos retoques:

  1. Elimina la palabra "Encuestados" de la etiqueta para ahorrar espacio.

  2. Arrastra [Rol profesional] a la estantería Columnas.

    Puedes ver el resultado en la Figura 1-21.

A small-multiples donut chart, which includes separating out the distribution by gender among different professions
Figura 1-21. Un gráfico de donuts de múltiplos pequeños, que incluye la separación de la distribución por sexo entre las distintas profesiones

Ahora que has visto algunos ejemplos de gráficos circulares, esperamos que reconozcas cuándo es apropiado utilizarlos y, lo que es más importante, cuándo su utilización puede mejorar la presentación de los datos para tu público.

Conclusión

Ahora has tenido la oportunidad de ver distintos tipos de gráficos utilizados para el análisis categórico. Empezaste con un gráfico básico de barras horizontales y rápidamente aprendiste a crear un gráfico Top N para limitar los datos de tu audiencia a la información más relevante.

A partir de ahí, exploraste la agrupación dinámica de pequeñas categorías en una barra Otros y permitiste a tu público definir el alcance del análisis con un parámetro, permitiéndole definir el porcentaje de contribución que debe tener una categoría para mostrarse en el gráfico.

También exploraste el uso de la codificación de colores con los gráficos de barras para acentuar aún más el análisis categórico y aprendiste algunas de nuestras técnicas de formato favoritas para hacer que los gráficos de barras destaquen.

A continuación, pasamos a nuestro caso práctico de Amplificar el rendimiento y utilizamos un mapa de árbol para garantizar que todos los miembros de una dimensión (¡incluso los realmente pequeños!) estuvieran representados en una visualización. Aprendiste a hacer aún más dinámico este tipo de gráfico permitiendo el desglose para dividir aún más los datos. Y también utilizaste la codificación de colores y te metiste de lleno en los cálculos de fechas para mostrar a los ejecutivos de la AP qué áreas pueden no estar recibiendo financiación (si esto te pareció divertido, espera al Capítulo 4).

Por último, terminamos el capítulo explorando los gráficos de postre, primero el gráfico de tarta y luego el de donut. Aprendiste cuándo utilizar eficazmente un gráfico de tarta (no demasiados trozos) y cómo aprovechar el hueco de un gráfico de rosquilla para mostrar dos datos a la vez.

Con todas estas nuevas técnicas, estamos seguros de que podrás crear visualizaciones flexibles, convincentes y perspicaces que permitan a tu público explorar preguntas y análisis de forma dinámica.

En el siguiente capítulo, te introduciremos en el análisis cuantitativo: todos los gráficos se centran en diferentes formas de trazar campos numéricos y de utilizar estadísticas. Tomarás los fundamentos que aprendiste creando gráficos y los pondrás en práctica con diversos tipos de gráficos (adiós, gráfico de barras).

Get Estrategias de mesa now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.