Capítulo 4. Hagamos algunas fotos (Visualización de datos 101)
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Anteriormente hemos tratado los aspectos básicos de la interfaz de usuario de Power BI, tocando las vistas Informe, Datos y Modelo, así como Power Query. En el capítulo anterior, importamos nuestro primer conjunto de datos de nuestro conjunto de datos Cool School University.
En este capítulo, vamos a repasar algunas ideas básicas sobre por qué visualizamos los datos. Después, utilizando nuestros datos del capítulo anterior, haremos un recorrido por las múltiples visualizaciones disponibles por defecto en Power BI.
¿Por qué visualizar datos?
Imagínate esto. Corre el año 1950 y eres contable en una pequeña empresa manufacturera del Medio Oeste. Serviste en la Segunda Guerra Mundial como contable en el Departamento de Guerra, asegurándote de que los fondos de los bonos de guerra se gastaban eficazmente para ayudar al esfuerzo bélico de los Aliados.
Para hacer todo tu trabajo, tenías un libro de contabilidad. Eso era todo. Así, cada día registrabas las transacciones de una cuenta a otra, asegurándote de que todo el dinero estaba donde debía estar.
Un día, el jefe de planta de la fábrica viene a la oficina de contabilidad para hacerte unas preguntas sencillas. "Oye, tengo curiosidad. ¿Cuál de nuestros productos nos hace ganar más dinero? ¿Y por unidad? ¿Y son el mismo producto?"
Ahora bien, como contable de los años 50, ¿entregarías de buen grado tu libro de contabilidad sin más? Por supuesto que no. Jamás. El libro de contabilidad era el alma de un contable, y entonces alguien habría tenido que arrancártelo de tus frías y muertas manos antes de que te desprendieras de él.
Lo que harías es, con los datos recopilados, elaborar una tabla que mostrara la lista de productos, los beneficios totales por producto y el beneficio por unidad de cada producto. Podríamos llamar a esa tabla una visualización de datos muy sencilla.
Ahora, por el bien de la discusión, digamos que otro contable (no tú, que eres demasiado listo) consideraría simplemente entregar su libro de contabilidad y decir: "Claro, ya te las apañarás. Aquí está el registro".
¿Tendría sentido? No. No tiene sentido por dos razones. En primer lugar, el jefe de planta y su equipo no van a estar tan familiarizados con los datos. Ellos no los recopilaron. No hicieron todos los cálculos, y es probable que no sean contables. Así que, aunque un contable les entregara el libro de contabilidad, el jefe de planta y su equipo podrían tener dificultades para seguir la lógica. En segundo lugar, el contable ya había hecho todo ese trabajo, así que ¿por qué iban a pedirle a alguien que lo volviera a hacer? Eso no es eficiente.
Volvamos a nuestro ejemplo y a los datos. Descubrimos que el widget A tiene la mayor rentabilidad total y el widget B tiene la mayor rentabilidad por unidad. La siguiente pregunta es: "¿Es cierto sólo para este año o lo es históricamente?".
Podría crear una tabla aún más complicada. Podría tener columnas para cada año y hacer el cálculo por producto y reunir una bonita matriz. Aunque algunas personas pueden mirar la matriz y seguirla, parte de nuestro público ahora no capta el impacto de los datos.
Quiero que los datos sean lo más comprensibles posible, así que creo un gráfico sencillo con un eje x para el año y un eje y para la rentabilidad. Trazo los puntos y dibujo una línea muy sencilla que muestre la tendencia de esos productos, separándolos en su propio gráfico para mayor claridad.
¿Qué crees que se grabará mejor en la mente de la gente? ¿La matriz o los gráficos?
Respóndete a esta pregunta. Seguro que alguna vez has asistido a una reunión o a una presentación en la que alguien mostraba datos en forma de una tabla larga y tendida, y quizás fue entonces cuando sentiste que empezabas a desviarte un poco. Otro presentador mostró los datos mediante gráficos e imágenes. ¿Cuál te pareció más atractiva?
Estoy dispuesto a apostar que la inmensa mayoría de la gente encuentra el enfoque gráfico mucho más atractivo. Estoy seguro de ello porque nos sentimos intrínsecamente atraídos por las historias. Nos atraen las historias porque somos más naturalmente capaces de tomar una historia y aprender lecciones de ella que de una lista de hechos.
Se aprovecha el hecho de que nos resulta más fácil identificarnos con estas anécdotas que con los datos concretos. Por ejemplo, es posible que hayas tenido una mala experiencia con un inmigrante indocumentado. Esa anécdota dejó una impresión y cuando una nueva organización impulsa historias individuales de fechorías, resulta más fácil aferrarse a esa historia cualitativa por encima de las resmas de datos que demuestran que los trabajadores indocumentados cometen delitos en un porcentaje mucho menor que los ciudadanos nacidos en el país.
Tenemos todo tipo de prejuicios con los que debemos luchar, y tenemos que ser capaces de ver y comprender los hechos para superarlos. Pero si hay que elegir entre unos datos que no cuentan nada y una historia que sirve a nuestros prejuicios, ganará la historia que sirve a nuestros prejuicios.
La visualización de datos utiliza fundamentalmente ese fenómeno de la narración como enseñanza en nuestro beneficio. La visualización de datos activa de forma única las tres partes de los antiguos modos griegos de persuasión: ethos, pathos y logos. El arte de hacer el trabajo para crear la visualización demuestra tu dominio de los datos, dándote una credibilidad ethos. Mostrar los datos en forma de imágenes que se entiendan fácilmente y te permitan contar una historia es el núcleo del pathos, o atractivo emocional. Por último, los propios datos, suponiendo que se hayan recogido y gestionado adecuadamente, sólo deben decirte la verdad. En el fondo, los elementos de los datos son los hechos, y los hechos constituyen el atractivo logos del argumento.
Visualizamos datos porque somos narradores. No contamos nuestras historias desde el capricho de nuestra imaginación. Contamos nuestras historias a partir de los hechos, estableciendo nuestra credibilidad y comprensión de esos hechos. A partir de ahí, hacemos esa historia lo más digerible posible. Y, de nuevo, la historia se basa en miles o millones o miles de millones de puntos de datos, no sólo en unas pocas anécdotas, lo que contribuye a la credibilidad.
Recordando el adagio de que una imagen vale más que mil palabras, un buen gráfico puede valer millones o miles de millones de filas de datos. Eres un narrador, y eres el mejor tipo de narrador, el que da sentido a lo que realmente está ocurriendo. Ya sea para encontrar la respuesta o para hallar la pregunta verdaderamente importante que necesita respuesta, la narración con visualización de datos puede ayudarte a conseguirlo.
Así pues, hablemos de las herramientas de visualización que nos ofrece Power BI para contar esa historia con nuestros datos. Piensa en estas herramientas como en el alfabeto. Una vez que te familiarices con ellas, aprenderás a formar palabras con ellas, luego llegarás al punto de contar historias con ellas y, con el tiempo y la práctica, descubrirás cómo utilizar cada visualización con el máximo efecto. Con esto en mente, hablemos de dónde empieza todo, el panel Visualizaciones.
El panel Visualizaciones
El panel Visualizaciones es tu lugar de referencia para añadir visualizaciones a , modificarlas añadiendo los puntos de datos necesarios, dar formato a tus visualizaciones o añadir capacidades analíticas adicionales que Power BI admite en algunas de estas visualizaciones. El panel Visualizaciones consta de tres partes principales: Campos, Formato y Análisis. Mira el panel Visualizaciones recientemente actualizado en la Figura 4-1.
Campos
Es importante tener en cuenta que cada visualización tendrá un aspecto diferente de las demás visualizaciones del área Campos, porque todas aceptan entradas distintas. Una visualización de mapa no va a ser igual que un gráfico de barras, que no va a ser igual que una matriz. Si ya tienes campos en un visual y decides cambiar el tipo de ese visual por otro distinto, Power BI hará todo lo posible por reasignar los campos y medidas seleccionados al nuevo visual; pero no está garantizado que funcione como pretendías. Puedes cambiar el tipo de un visual que ya esté en el lienzo seleccionando ese visual y haciendo clic en una visualización diferente en el panel Visualizaciones. Eso es todo.
Los elementos comunes que aparecerán en muchos visuales del panel Campos incluyen Eje, Leyenda y Valores. Un eje define cómo estás categorizando tus datos. Una leyenda divide los datos en subsecciones y resalta esas distinciones. Los valores son los valores reales que quieres agregar a través de esas agrupaciones.
En los Campos, siempre habrá una sección en la parte inferior para las opciones de "Profundizar". Esta fantástica función te permite tomar un visual y aplicar los filtros de ese visual a otro visual de otra página, llevándote directamente a esa página del informe y a su conjunto de visuales. El "Desplazamiento" es una forma estupenda de llevar información de una parte de tu informe a otra y de mantener el contexto sincronizado.
Formato
En versiones anteriores, el panel Formato se representaba con un icono de un rodillo de pintura. Ahora, cuando un visual no está seleccionado, aparece como un pincel sobre una página. Pero cuando se selecciona un visual en el lienzo, aparece como un pincel sobre un gráfico de barras. El formato te permite personalizar el aspecto de una visualización determinada para satisfacer tus necesidades específicas.
Al igual que con los Campos, las opciones elegibles en Formato son contextuales a la visualización que se está modificando. Hay muchas opciones disponibles, y si alguna vez has utilizado PowerPoint, muchas deberían resultarte familiares. Cada sección de Formato tiene una flecha al lado que permite abrirla o contraerla. Esto puede ser útil para la navegación. Algunas funciones de Formato tienen una funcionalidad distinta, pero para el propósito de este ejercicio, concéntrate en la idea de que Formato es el lugar al que acudes para hacer que tus visualizaciones destaquen realmente.
Analítica
Las funciones de Análisis de , a las que se accede haciendo clic en en el icono de una lupa mirando un gráfico, no funcionan en todas las visualizaciones, y es importante tener en cuenta que ningún visual personalizado puede aprovechar el área de Análisis. Sin embargo, para las visualizaciones en las que sí funciona Analítica, puedes utilizar esta funcionalidad para añadir líneas constantes de comparación, líneas de valor mínimo para identificar cuándo algo está por debajo de un umbral determinado, una línea de máximo para el propósito inverso, una línea de media, una línea de mediana, una línea de percentil o una línea de tendencia, o incluso hacer detección de anomalías.
Hay muchas funciones en Analytics, pero utilizarlas eficazmente depende del contexto, así que no tengas miedo de probar cosas para ver lo que funciona o no para ti y tu proyecto.
Interactividad visual
Antes de entrar en detalles sobre las visualizaciones reales, deberíamos hablar de una de las características más potentes de una página de informe de Power BI: la interactividad visual. Por defecto, cualquier visualización que pongas en una página de informe puede filtrar cualquier otra visualización de la página. Esto permite al usuario llegar rápidamente a combinaciones específicas de datos que podría estar buscando.
En la Figura 4-2, ves una sencilla página de informe con dos visuales. Uno es un mapa visual que muestra el número de alumnos que tengo en mi clase de cada estado, y el segundo es una simple barra que muestra la puntuación media de todas las tareas.
Cuando hago clic en cualquiera de esas burbujas del mapa, el visual de la puntuación media cambiará para reflejar el subgrupo específico que he seleccionado en el visual del mapa. Observando el mapa visual, puedo ver que muchos de mis alumnos son de Indiana. Pero quiero ver cómo se comparan mis alumnos de otros estados con la media, por ejemplo. Cuando elijo la burbuja de Michigan, obtengo el resultado que se muestra en la Figura 4-3. A modo de demostración, he capturado la imagen mientras pasaba el ratón por encima del resultado del gráfico de columnas para que te resulte más claro.
Puedes ver en el visual del mapa que ahora todas las demás burbujas son transparentes, lo que indica que he seleccionado una. Ahora, a la derecha, verás que el gráfico de columnas muestra un nuevo resultado. Muestra una columna resaltada, y detrás de esa columna resaltada, puedes ver el resultado original. A partir de aquí, puedo ver rápidamente que la puntuación media de mis alumnos de Michigan es superior a la media de todo el grupo de alumnos. Sin embargo, verás que no me da inmediatamente la media original sin los alumnos de Michigan. Este tipo de filtrado cruzado, que resalta un valor, no elimina la selección del valor original.
Así, esto compara la media de los estudiantes de Michigan con la media de todos los estudiantes, que sigue incluyendo a los estudiantes de Michigan. Si quisiéramos hacer algo un poco diferente, podríamos hacerlo con algunas medidas personalizadas, y hablaremos más de ello en nuestro capítulo sobre los fundamentos de DAX.
Ahora bien, a veces puede que no quieras que un determinado visual se filtre o se filtre de forma cruzada, y no todos los visuales tienen los mismos tipos de opciones de visualización de filtrado cruzado. Cuando tengas un visual seleccionado, en la cinta de opciones, bajo la pestaña Formato, verás un botón llamado "Editar interacciones". A diferencia de otros botones de los que hemos hablado, éste está activado o desactivado. Cuando está activado, verás en la esquina de cada visual de la página de tu informe algunos iconos diferentes; de nuevo, no todos los iconos estarán en todos los visuales.
Tomemos, por ejemplo, el gráfico de columnas de nuestras figuras anteriores; con la opción "Editar interacciones" activada y el visual del mapa seleccionado, veríamos tres iconos, como se muestra en la Figura 4-4. Los iconos son muy pequeños. Ojalá Microsoft hiciera estos iconos de interacción un poco más evidentes, pero no lo son. Cuando diga que un icono está seleccionado, aparecerá como "relleno", en lugar de transparente. En el ejemplo, puedes ver que el botón central está relleno, así que ése es el tipo de filtrado cruzado que realiza el visual del mapa contra el visual de la columna.
A la izquierda está la opción Filtro. Esto filtraría estrictamente el resultado para mostrar sólo el resultado filtrado; así, en este caso, veríamos sólo el resultado de los Michiganders, en lugar del resultado frente a toda la media. La segunda opción es la opción Resaltar, que hace lo que has visto en la Figura 4-3. La última opción es Ninguno, que significa que el visual seleccionado no filtrará ese visual en absoluto.
Gráficos de columnas y barras
Los gráficos de columnas y barras normalmente tienen un diseño de ejes x-/y- muy sencillo. Toma los valores y compáralos en dos dimensiones, y obtén alguna información a partir de ahí. Algunos gráficos nos permiten añadir un segundo eje y para utilizarlo cuando queramos superponer un valor a otro. En la categoría de gráficos de columnas y barras, Power BI tiene los siguientes elementos visuales por defecto (en su orden en el panel Visualizaciones, de izquierda a derecha, de arriba abajo, omitiendo los elementos visuales que no son relevantes para esta parte del texto):
-
Gráfico de barras apiladas
-
Gráfico de columnas apiladas
-
Gráfico de barras agrupadas
-
Gráfico de columnas agrupadas
-
Gráfico de barras apiladas al 100%
-
Gráfico de columnas 100% apiladas
-
Gráfico en cascada
Gráficos de barras y columnas apiladas
Los gráficos de barras y columnas apiladas consiguen el mismo objetivo con diferente verticalidad. ¿Cuál es tu eje x y cuál tu eje y? Como buena regla general, utiliza gráficos de barras cuando compares con valores discretos y utiliza columnas cuando midas con valores continuos como el tiempo, por ejemplo. Pero no es una regla rígida.
Para este gráfico, voy a fijarme en la diferencia entre los alumnos para los que ésta es su primera clase en el departamento y aquellos para los que no lo es. Me gustaría saber su nota media, y me gustaría ver a cuántas horas de oficina asistió cada grupo.
Podemos ver los ejemplos de barras y columnas en la Figura 4-5. Observa que en estos dos gráficos, los valores que se superponen forman una suma de los valores que componen la visualización: en este caso, la puntuación media de las tareas y la suma de las horas de oficina de cada grupo. Esto nos da un valor combinado que nos permite comparar rápidamente varias columnas y encontrar resultados que pueden no ser intuitivos a primera vista.
Observando ambos gráficos, comparten las mismas entradas del panel Visualizaciones. Defines un eje. Puedes añadir una leyenda como categoría para subdividir aún más la barra o la columna, los valores que quieres revisar, pequeños múltiplos e información sobre herramientas.
La información sobre herramientas es lo que ves cuando pasas el cursor del ratón sobre una determinada parte del visual. Cuando la información sobre herramientas está vacía, Power BI reunirá una lista de valores en la información sobre herramientas basándose en lo que hay en el visual. Piensa en ello como una tabla rápida que puedes hacer aparecer para un determinado conjunto de datos para ayudarte a leer el visual. También puedes poner en la información sobre herramientas cosas que no estén necesariamente en el visual.
Gráficos de barras y columnas agrupadas
Un gráfico de barras o columnas agrupadas toma los valores y los separa en elementos discretos respecto a un eje, en lugar de agregarlos. En los gráficos apilados, básicamente tenemos una barra o columna que combina todos los valores juntos. En el gráfico agrupado, obtenemos una barra o columna distinta para cada valor de nuestro eje x.
En el ejemplo de la Figura 4-6, quiero ver si hay alguna discrepancia real entre las puntuaciones medias por etnia y por edad. Quiero ver cada etnia resaltada por separado, pero quiero ver cómo se comparan las edades entre sí y cómo se compara la puntuación media de forma más objetiva. Puedo hacerlo separando los valores de la edad media y la puntuación media. La Figura 4-6 nos muestra este aspecto en forma de barra y de columna.
Este conjunto de gráficos hace un buen trabajo al demostrar que la forma de presentar los datos importa. Si nos fijamos en la parte superior de la Figura 4-6, es más fácil ver la diferencia de edad media que existe en cada grupo étnico. Creo que esto es un poco más difícil de ver en el ejemplo de la columna. Sin embargo, tanto el gráfico de columnas como el de barras muestran bien la diferencia en la puntuación media.
A veces, cambiar un valor de un eje x a un eje y puede suponer una gran diferencia, y recuerda que por defecto los ejes son dinámicos. Eso es algo que debes tener en cuenta cuando elijas gráficos de barras o de columnas, o si sientes la necesidad de establecer manualmente los valores de los ejes (lo que podrías hacer en el área de campos de este grupo de visualizaciones, en la categoría de ejes correspondiente).
Gráficos de barras y columnas 100% apilados
Los gráficos de barras y columnas apiladas al 100% toman un conjunto dado de valores a través de las dimensiones y calculan, para ese total, qué porcentaje del total pertenece a cada sección específica de la agrupación. Esto normaliza el resultado entre categorías porque se basa en porcentajes en lugar de valores absolutos.
Por ejemplo, en nuestra clase tenemos muchos menos alumnos deportistas que alumnos que no lo son. Si nos fijáramos en el número total de horas de oficina a las que asistió cada grupo, los no deportistas parecerían un grupo mucho mayor. Sin embargo, ¿qué ocurre si intento averiguar si una asignatura concreta tuvo más horas de despacho en un grupo que en otro? Ese es un ejemplo en el que normalizar los datos puede resultar útil, como vemos en la Figura 4-7.
Aquí tenemos 13 tareas con horas de oficina asistidas. Podemos ver que nuestros estudiantes deportistas sólo asistieron a las horas de consulta de las tareas 5, 6, 7 y 12. La tarea 12 tuvo un 20% más de horas de consulta que las demás. La tarea 12 tuvo un 20% más de horas de consulta que las demás. Vemos que, para los no deportistas, la distribución es bastante uniforme entre las tareas. No es perfectamente uniforme, pero casi.
Si estuviéramos dando esta clase, esto podría llevarnos a hacer algunas preguntas adicionales. ¿Hubo algún problema en los horarios deportivos que dificultara la asistencia a las horas de oficina? ¿El interés adicional al final del semestre se debió a que los estudiantes deportistas no estaban rindiendo bien, o fue una mera coincidencia? Algunas de estas preguntas puedo responderlas a partir de los datos, y otras probablemente no, pero espero que puedas ver algunos ejemplos de preguntas que podría plantearme a medida que desarrolle mi informe o mi investigación sobre el tema.
Múltiplos pequeños
Múltiplos pequeños es una función que te permite dividir el visual en rebanadas manteniendo los ejes comunes. Digamos que quiero dividir esto en cuatro cuadrantes utilizando el identificador de estudiante deportista y la bandera de género. Podría verlo dividido en las cuatro combinaciones -no es deportista y es mujer, no es deportista y es hombre, es deportista y es mujer, es deportista y es hombre- manteniendo el valor de mi eje central. Así obtenemos la vista representada en la Figura 4-8, que también contiene un ejemplo de un valor de información sobre herramientas que no está en ninguna otra parte del visual (en este caso, la edad media de esa agrupación de datos).
Tomémonos un segundo para hablar de las inferencias que podemos sacar. Sabemos que no hay atletas masculinos para los que éste no sea su primer curso. Sabemos que ocurre lo contrario con las mujeres deportistas. Podemos ver que la puntuación media es más alta en todos los grupos para aquellas personas para las que no es su primera clase. Y, en general, sabemos que los que cursaban su primera clase en el departamento asistían a más horas de consulta, pero esas horas de consulta no conseguían que los primerizos alcanzaran el nivel de los estudiantes más experimentados del departamento.
Gráfico de cascada
Un gráfico de cascada recopila por una categoría determinada cómo ha cambiado un valor a lo largo de esa categoría hasta mostrarte el valor total final. Esto puede ser útil cuando tienes una combinación de rasgos positivos y negativos que contribuyen a un total, de modo que puedas desglosarlos y compararlos entre sí. No tenemos calificaciones negativas para nadie, así que la Figura 4-9 muestra un gráfico de cascada unidireccional que muestra el cálculo de las horas de oficina a las que se ha asistido por AssignmentID antes de mostrar el número total de horas de oficina a las que se ha asistido en el semestre.
Gráficos lineales y de área
Los gráficos de líneas y áreas, al igual que los gráficos de columnas y de barras , tienen un tema muy centrado en los ejes x e y. La diferencia suele ser que puede ser más fácil ver tendencias o hacer comparaciones con líneas o áreas, viendo dónde pueden solaparse los datos de una serie temporal u observando dónde pueden cruzarse ciertas categorías.
Además, Power BI tiene un conjunto de gráficos que combinan gráficos de columnas con gráficos de líneas que trataremos en esta sección. De nuevo, la lista de visualizaciones de esta categoría se lee de izquierda a derecha, de arriba abajo, saltándonos las visualizaciones que no están en esta sección:
-
Gráfico lineal
-
Gráfico de áreas
-
Gráfico de áreas apiladas
-
Gráfico de líneas y columnas apiladas
-
Gráfico lineal y de columnas agrupadas
-
Gráfico de cintas
Gráfico lineal
En realidad, un gráfico de líneas no es muy diferente de un gráfico de columnas, salvo que es más fácil ver las tendencias con líneas que con columnas. Los gráficos de líneas también funcionan mejor con un eje continuo, porque cuando hay un hueco, el gráfico de líneas rompe la línea y la retoma para el siguiente valor de la serie del eje. Si observas las opciones del panel Visualizaciones para los gráficos de columnas y de líneas, verás que son increíblemente similares, salvo que el gráfico de líneas tiene una opción adicional para Valores secundarios. Esa sección está ahí por si queremos hacer dos ejes y uno contra otro, que es la característica única de los gráficos de líneas. Esto puede ser útil cuando quieres comparar las tendencias de dos valores, pero pueden tener órdenes de magnitud muy diferentes.
Un buen ejemplo empresarial de esto es comparar el precio medio de mis productos con mi beneficio total. El precio medio de mis productos va a ser inferior a mi beneficio total (o al menos debería serlo, o tienes problemas mucho mayores de los que este libro puede resolver realmente). Si pusiera esos valores en el mismo eje -digamos, beneficios en millones y precio medio en cientos-, la línea del precio medio parecería prácticamente plana y cercana a cero en comparación con los millones de beneficios. Sin embargo, si los pongo en ejes diferentes, con cada eje y midiendo su propio orden de magnitud, podemos resolver ese problema y ver mejor las tendencias juntas.
En la Figura 4-10, he creado un gráfico de líneas que muestra la puntuación media por ID de tarea junto con el recuento de ID de alumnos para cada tarea. Incluso en el ejemplo proporcionado, el número de alumnos no alcanza el nivel de la puntuación media en ninguna tarea, ni siquiera en la de puntuación más baja.
Cuadro de áreas
Un gráfico de áreas tiene las mismas opciones de categoría que un gráfico de líneas. Piensa en un gráfico de áreas como un gráfico de líneas con los valores por debajo de la línea rellenados. ¡Voilà, gráfico de áreas! En mi opinión, el gráfico de áreas hace dos cosas que proporcionan buenos casos de uso. El primer caso es cuando tienes datos que cambian con el tiempo y quieres dar al lector una idea de la proporción de ese cambio. Un buen ejemplo es observar el cambio de la población a lo largo del tiempo.
También puedes utilizar un gráfico de áreas para ver más fácilmente dónde se solapan dos o más valores, o -el caso más interesante para mí- dónde no se solapan. La Figura 4-11 es igual que la Figura 4-10, salvo que es un gráfico de áreas. Al final del gráfico, para la tarea 14, verás que el área rellenada bajo la línea del recuento de alumnos no está rellenada también por la puntuación media, porque la puntuación media bajó. Esa zona rellena es un buen indicador visual de que hay algo anormal o que merece la pena seguir investigando.
Gráfico de áreas apiladas
Un gráfico de áreas apiladas es un poco diferente de un gráfico de áreas en el sentido de que no sólo te muestra los valores individuales del área, sino que también crea un agregado de los valores del área, permitiéndote ver tanto las partes individuales de un total como el total al mismo tiempo.
Imagina que tienes un negocio con varios modelos de suscripción: plata, oro y platino. El gráfico de áreas apiladas puede ser estupendo en un ejemplo como éste, porque te mostrará las áreas plata, oro y platino superpuestas, permitiéndote ver las suscripciones combinadas, así como sus partes componentes.
La Figura 4-12 muestra un gráfico de áreas apiladas para que podamos ver nuestras puntuaciones medias por tarea según el número de años que un alumno ha estado en la escuela. Si nos fijamos en AssignmentID 3, podemos ver que, por alguna razón, los alumnos con un año en la escuela tuvieron realmente dificultades con esta tarea. ¿Quizá ya se han acostumbrado a dormir hasta tarde?
Gráfico de líneas y columnas apiladas/Gráfico de columnas agrupadas
Ya hemos hablado de los gráficos de columnas apiladas y agrupadas en este capítulo. ¿Qué aporta una línea a estos gráficos? Pues bastante. La posibilidad de tomar un gráfico de columnas y superponerle un valor de línea en un eje diferente puede ampliar mucho el análisis.
Por ejemplo, en la Figura 4-13, desgloso la puntuación media por raza de la línea, pero utilizo una columna agrupada en la suma total de todas las puntuaciones. Esta vista me indica rápidamente que los blancos son mayoría en mi clase, pero que los alumnos negros o afroamericanos tienen la puntuación media más alta. Sin embargo, la inclusión del segundo eje y también me dice que la diferencia en la puntuación media entre mis grupos raciales no es tan grande, oscilando entre unos 76 y un máximo de 80. Si yo fuera un profesor preocupado por que mi curso se ajuste pedagógicamente a las necesidades de todos mis alumnos, ¡tomaría este resultado de forma muy positiva!
Tabla de cintas
Un gráfico de cintas es algo parecido a un gráfico de áreas, pero en lo que realmente destaca es en mostrar cómo se clasifican las cosas entre sí. Puedes ver cómo fluye la cinta a través de la categoría. La información sobre herramientas de los gráficos de cinta también es excepcionalmente detallada cuando pasas el ratón sobre la parte de "transición" de la cinta. Así es como yo llamo a la parte de los gráficos que no son las columnas que se comparan.
Puedes hacerte una buena idea de un simple gráfico de cintas en la Figura 4-14, donde observamos el rango de la puntuación media de los que asistieron a las horas de oficina frente a los que no lo hicieron. Podemos ver al principio del semestre que los que no asistían a las horas de oficina lo hacían mejor, pero luego eso cambia en la Semana 5, de modo que los que asistían a las horas de oficina lo hacían mejor. ¿Qué preguntas te plantea esto?
Donuts, puntos y mapas, ¡vaya por Dios!
Esta siguiente sección de gráficos cubre un espectro un poco más amplio que las dos categorías anteriores. Me gusta agrupar estas cosas porque para mí no encajan necesariamente en otras categorías. Tienden a demostrar el efecto de las categorías más que a resumir un valor en una categoría. Dicho de otro modo, ¿qué aporta una categoría determinada a algo? Eso nos lleva a la siguiente lista de gráficos, de nuevo ordenados en el panel Visualizaciones, leyendo de derecha a izquierda, de arriba abajo:
-
Gráfico de embudo
-
Gráfico de dispersión
-
Gráfico circular
-
Gráfico de donuts
-
Mapa del árbol
Gráfico de embudo
Un gráfico de embudo es una visualización flexible. En esencia, un gráfico de embudo consiste en comparar una colección de datos con otra colección de datos para ver lo cerca o lejos que está.
Uno de mis ejemplos favoritos de gráfico de embudo es de cuando trabajaba en análisis de operaciones en un centro de llamadas. Ese centro de llamadas hacía coaching telefónico, y era importante saber cuántas veces conectábamos o interactuábamos con éxito. Utilizaba un gráfico de embudo para mostrar el total de nuestra población elegible y, a continuación, el número de personas con las que interactuábamos una vez, dos veces, tres veces, etc. Cada alcance sucesivo era más difícil de conseguir, y no podías llegar a alguien por tercera vez a menos que hubieras llegado a ellos una segunda vez. Esto nos permitió comprender rápidamente nuestra tasa de conversión en cada nivel de captación de clientes.
En nuestro ejemplo de la Figura 4-15, estamos viendo un caso de uso diferente para el embudo: una lista preseleccionada de puntuaciones medias por alumno. Presta especial atención al tooltip, la información que aparece en el recuadro negro de la Figura 4-15. Muestra el porcentaje del valor resaltado en comparación con el valor superior. Muestra el porcentaje del valor resaltado en comparación con el valor superior. El Sr. Schmitz, con una puntuación media de 85,36, tiene una media que es el 92,28% de la puntuación máxima (la de Montegalegre) y una puntuación media que es el 97,47% de la de Boomhower.
Gráfico de dispersión
El gráfico de dispersión es uno de los elementos visuales más útiles y más enloquecedores de Power BI. Seré franco: es voluble. Hay demasiadas formas de obtener un error de este visual cuando lo estás construyendo. Si tienes datos que puedes representar bien en pares X e Y, el gráfico de dispersión es fantástico. Otro de sus usos es mostrar cómo cambian los valores a lo largo del tiempo. Como nota adicional, tu eje Y debe ser siempre numérico; no puede ser categórico. Tu eje X puede ser numérico o categórico.
En el ejemplo de la Figura 4-16, estamos viendo nuestra puntuación media por asignación entre estudiantes deportistas y no deportistas. Lo que hemos añadido que es exclusivo del gráfico de dispersión es el eje Reproducir, que nos permite recorrer algunos filtros categóricos en secuencia para ver cómo cambian estos valores con el tiempo. Esto puede funcionar muy bien con datos continuos que utilicen fechas o, como en este caso, estoy utilizando los ID de asignación, que son numéricos, para recorrer el cambio en el orden de asignación.
Gráfico circular y de donuts
Puedo oír los gritos de los profesionales de las finanzas de todo el mundo: "¡Jeremey! ¿Por qué están juntos? No son en absoluto lo mismo!" Quiero que todo el mundo lo tenga claro. Un gráfico de donuts es un gráfico circular con un agujero en medio. Hacen exactamente lo mismo, que es demostrar el porcentaje de un valor total que representa una determinada categoría.
Ahora mírame, y con mírame quiero decir que dejes de leer, levantes los ojos al cielo y oigas mi voz incorpórea en tu cabeza. Los gráficos de tarta y de rosquilla están sobrevalorados y se utilizan en exceso. ¿Significa esto que son malos? No, claro que no. Pero, naturalmente, es más fácil comparar líneas y barras entre sí que comparar "áreas" de valores.
¿Tu gráfico circular tiene 74 valores que está comparando? Eso es malo. ¿Es una auténtica tarta de crema de azúcar de Zionsville, Indiana? Entonces está bien. ¿Tu donut está hecho con algún sucedáneo de harina vegano y sin gluten de un callejón de Portland, Oregón? Probablemente no esté bueno. En serio, ve a Coco's. El vudú está sobrevalorado. Las figuras 4-17 y 4-18 muestran las tartas y los donuts buenos frente a los malos.
Mapa de árbol
El mapa de árbol es el gráfico de donuts del siglo XXI, es decir, se puede utilizar bien y se puede destruir si lo llenan demasiadas categorías. Sin embargo, una ventaja que tiene el mapa de árbol sobre sus homólogos de tarta y donut es que es más fácil distinguir entre cuadrados grandes y cuadrados pequeños. Me gusta utilizar los mapas de árbol como filtro cruzado en muchas páginas de informes en las que las categorías y subcategorías existen de forma natural para resaltar subsecciones específicas de datos para un mayor análisis.
Un mapa de árbol más grande, como el de la Figura 4-19, es útil para identificar grandes grupos de un vistazo. En este caso, buscamos combinaciones de sexo y etnia para ver qué grupos asistieron al mayor número de horas de oficina. Podemos ver fácilmente que las mujeres asistieron más horas que los hombres, y podemos ver qué grupos étnicos asistieron a esas horas.
Mapas visuales
Los mapas visuales hacen exactamente lo que crees que hacen: alinean los datos con categorías geográficas para mostrarte detalles sobre los datos en esas categorías. Bastante sencillo. Power BI tiene varios visuales de mapa que pueden ayudarte a llegar a donde quieres ir.
El mapa visual básico ofrece la posibilidad de definir una ubicación u ofrecer puntos de datos de latitud y longitud para definir los parámetros de tu mapa. El mapa relleno es básicamente lo mismo que el mapa, salvo que rellena las categorías geográficas relevantes, en lugar de poner puntos basados en el tamaño.
Cuando recibas este libro, puede que el mapa visual de formas haya salido por fin de la fase beta (en la que ha estado durante años). El mapa de forma no utiliza Bing o Azure para su funcionamiento, sino que utiliza TopoJSON personalizados para definir la forma y la estructura del mapa. Un TopoJSON es un formato de archivo especial que contiene datos geográficos semiestructurados. Si te encuentras en una situación en la que necesitas un mapa personalizado, comprueba si tienes un TopoJSON creado internamente o encuentra uno de los muchos y magníficos recursos en línea para obtener un TopoJSON del mapa que necesitas.
El mapa Azure te permite definir los límites de latitud y longitud que pueden pasarse a TomTom para generar un mapa muy parecido al visual del mapa de formas. Con los visuales de mapa, mi sugerencia es que pruebes cada visual de mapa y veas cuál funciona mejor para ti y tus necesidades.
Los visuales "planos
Los visuales planos existen para mostrar información simple y directa que quieres que vea tu lector. Por lo general, estos visuales no filtran a otros, sino que se filtran a sí mismos, con una excepción obvia: el visual de corte. Estos elementos visuales pueden parecer sencillos, pero a menudo añaden a un informe ese toque mágico y extra de contexto que convierte los datos en una historia con sentido. Lo hacen resaltando aquellas cosas específicas que realmente quieres que tu audiencia comprenda. En esta categoría, tenemos los siguientes elementos visuales:
-
Galga
-
Tarjeta
-
Tarjeta multifila
-
KPI
-
Cortadora
-
Tabla
-
Matriz
Galga
Los indicadores son una de las formas más antiguas de visualización de datos que tenemos. Se han utilizado en máquinas e ingeniería durante la mayor parte del siglo XX. Un indicador te dice fundamentalmente cómo está un valor en comparación con sus valores mínimo y máximo junto a un objetivo. El indicador es útil para establecer objetivos y ver rápidamente si estás por encima o por debajo de ese valor objetivo. También puede ser útil cuando quieres mantener un valor en un rango específico, ni demasiado caliente ni demasiado frío.
En el ejemplo de la Figura 4-20, comparamos la puntuación media con nuestra medida de puntuación media objetivo.
Tarjeta/Tarjeta de varias filas
El visual de tarjeta es uno de los más sencillos de Power BI. También es uno de los más autoexplicativos por su nombre. Cuando se le da un valor, toma ese valor y lo pone en una tarjeta cuadrada con una breve nota sobre qué es lo que se está viendo.
Para mí, la tarjeta hace bien dos cosas. Primero, en su simplicidad, es fácil entender lo que estás leyendo. Combina esto con el filtrado cruzado, y el visual de la tarjeta puede destacar rápidamente un valor específico para cualquier combinación de datos con facilidad. En segundo lugar, ayuda al proceso de narración al atraer a los lectores hacia valores específicos que crees que deben importarles, ya sea porque son importantes por sí mismos o porque proporcionan el contexto necesario que hace que los demás visuales de la página de tu informe tengan más sentido.
El visual de tarjeta de varias filas es como el primo del visual de tarjeta al que tus tíos adoran constantemente en Acción de Gracias, pero que en realidad no estás seguro de que sea tan bueno. La tarjeta de varias filas pone, sin inspirar, múltiples valores en un único espacio similar a una tarjeta. Si todos los valores son agregaciones, tendrá un aspecto bastante limpio. Sin embargo, si tienes agregaciones y luego alguna dimensión que categorice esas agregaciones, la tarjeta de varias filas creará varias filas en la tarjeta, detallando los valores agregados para cada valor categórico.
En la Figura 4-21, tenemos una tarjeta simple a la izquierda y dos tarjetas de varias filas a la derecha: una con sólo agregaciones en la parte superior, y dividida por StudentID en la parte inferior para distinguir la diferencia más fácilmente. Observa cómo el segundo visual de varias filas también tiene una barra de desplazamiento para ayudar a navegar por el visual, porque ahora es más largo que el espacio asignado.
KPI
El visual de indicadores clave de rendimiento (KPI) es una de esas cosas que a primera vista suena muy bien, pero que inevitablemente conduce a un lugar de frustración. No es tan malo como el gráfico de dispersión, pero el visual de KPI no es intuitivo al principio.
Hay un campo indicador, que es lo que realmente estás midiendo. Hay un eje de tendencia, que es como el visual mostrará los resultados en un eje x que no se muestra. Luego está el objetivo meta, al que debemos situarnos por encima o por debajo.
Un ejemplo clásico de caso de uso de un KPI es algo como los ingresos del año en curso frente a los ingresos del año anterior por mes fiscal. En nuestro ejemplo, estamos viendo nuestra puntuación media comparada con nuestro objetivo de nota media de 75. El gráfico muestra cómo nos ha ido en comparación con ese objetivo.
Lo exasperante del KPI es que siempre muestra el valor del último valor del eje, independientemente de lo que haya ocurrido antes, aunque visualizará esos valores en la parte del gráfico. Verás que en la Figura 4-22 he dejado abierto el panel Filtros para que puedas ver el aspecto visual en dos escenarios: uno en el que ignoro la Asignación 14, que es especial, y otro en el que no lo hago, para que puedas ver la diferencia en la forma en que el KPI visualiza esos resultados.
Tabla/Matriz
Así que voy a disculparme, porque ésta es la única vez que voy a desviarme del orden y pasar por alto Slicer. Volveré a él después de los visuales de tablas y matrices. Son fáciles de entender si has utilizado Excel o Google Sheets, o si has mirado una tabla de una base de datos.
La mesa es exactamente lo que parece. Aquí no hay campanas ni silbatos. La visualización de la tabla, en el panel Visualizaciones, sólo tiene una inserción, y es en un campo de valores. Todo es un campo (columna), y todos los valores se asignan a esa columna. Puede parecer contraintuitivo tener un visual de tabla en una herramienta de visualización de datos, pero el visual de tabla puede proporcionar algunos detalles más específicos que pueden ofrecer un contexto adicional.
En muchos casos, prefiero una tabla a una tarjeta de varias filas para resaltar puntos de datos concretos. Otra cosa interesante que he hecho con los visuales de tabla es ponerlos al final de los informes para facilitar la extracción de datos a los analistas que quieran utilizar los datos de esa tabla para otros análisis.
La matriz es más parecida a una tabla dinámica de Excel, con la posibilidad de tener varios niveles de características de fila en los que profundizar. También se puede abusar de las matrices, pero cuando se utilizan para resaltar conjuntos o combinaciones específicas de datos, pueden ayudar a iluminar elementos concretos para los lectores o proporcionar un contexto adicional a los analistas que pueden averiguar qué preguntas necesitan ir a responder rápidamente.
Durante muchos años, al exportar datos de una matriz visual se perdía su formato matricial, ya que Power BI los ponía primero en una tabla y luego los exportaba. Sin embargo, esto ya no es así, de modo que si necesitas exportar datos en formato de matriz, quizá para una presentación o algo así, también puedes hacerlo. La Figura 4-23 muestra una tabla a la izquierda y una matriz a la derecha.
Cortadora
He guardado el rebanador para en último lugar porque su funcionalidad es fundamentalmente diferente de la de cualquier otro visual que hayamos revisado, pero eso no significa que sea menos importante. Un rebanador toma los visuales de una página y los filtra de acuerdo con el valor o valores seleccionados en el rebanador.
Un slicer no es muy diferente de tener una columna seleccionada mediante el botón "Filtros en esta página" del panel Filtros. Lo que es diferente, sin embargo, es que como visual en una página de informe, puedes editar cómo interactúa con todos los demás visuales de la página de informe utilizando la función "Editar interacciones" de la pestaña Formato de la cinta; y las rebanadoras pueden sincronizarse entre las páginas que elijas utilizando el panel "Sincronizar rebanadoras". Esto puede hacer que las rebanadoras sean mucho más flexibles e intuitivas para los lectores de tus informes. También te da a ti, como autor, otra oportunidad de identificar qué dimensiones consideras importantes para ayudar a tus lectores a entender cómo deben pensar sobre los datos.
En la Figura 4-24, puedes ver la rebanadora visual seleccionada en la esquina inferior izquierda, utilizando el ID de asignación. Observa cómo cambian los valores cuando selecciono distintas combinaciones del ID de asignación que quiero consultar.
Conclusión
Sí, el panel Visualizaciones tiene algunos otros visuales, pero no son realmente visuales para la sección 101. Si sabes hacer scripts en R o Python, ya sabes cómo utilizar las visualizaciones en R y Python, y hablaremos un poco más de las visualizaciones potenciadas por IA en el Capítulo 7. Power Apps, Power Automate e Informes paginados están un poco más allá del alcance de este libro, pero hay muchos recursos disponibles si te interesan esos temas.
En este capítulo, hemos repasado los fundamentos de la visualización en Power BI y hemos recorrido muchas de las visualizaciones que están disponibles directamente en Power BI Desktop. Y hemos comentado algunos de sus casos de uso. En muchos de los ejemplos visuales, hemos utilizado una medida sencilla, la puntuación media, como punto de referencia, pero ¿cómo hemos creado esa medida? Ahí es donde entra en juego DAX, y es a lo que nos dedicaremos a continuación. ¿Emocionado? Deberías estarlo.
Get Aprender Microsoft Power BI now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.