Kapitel 1. Kategorische Analyse

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Diekategoriale Analyse ist die Grundlage der Datenvisualisierung. Sie ist die erste und häufigste Art der Datenvisualisierung, die Datenanalysten verwenden. Bei der kategorialen Analyse wird eine Dimension (z. B. [Regionen]) nach einem Maß (z. B. [Umsatz]) unterteilt. Eine Dimension ist typischerweise ein kategorischer Wert; diese werden nicht aggregiert. Sie werden wahrscheinlich verwendet, um Datenköpfe zu erstellen oder Filter zu erzeugen. Eine Kennzahl ist ein (meist numerischer) Wert, der mit mathematischen Funktionen (wie Summe, Durchschnitt oder Median) aggregiert werden kann. Kennzahlen bilden ungebrochene Achsen, die sich von einem Ende eines Bereichs zum anderen erstrecken.

Diese Art der Analyse hilft bei der Beantwortung allgemeiner Geschäftsfragen wie diesen:

  • Was ist der Unterschied zwischen A und B?

  • Wie ist die Maßnahme X auf die Kategorien Y verteilt?

  • Wie hoch ist der Anteil von A, B und C an der Gesamtsumme?

  • Wie misst X die Veränderung im Laufe der Zeit (wobei die Zeit die Dimension ist)?

Kategoriale Analysen werden normalerweise als Balkendiagramme dargestellt. Balkendiagramme verwenden Höhe oder Länge als visuelle Kodierung, um ein Maß auszudrücken. Die visuelle Kodierung bezieht sich auf die Techniken, mit denen Daten in Diagrammen dargestellt werden; Abbildung 1-1 zeigt einige Beispiele. Die Kodierung von Daten in Balkendiagrammen ist effektiv, weil Menschen die Unterschiede in der Größe der Balken schnell analysieren können; sie sind außerdem leicht zu verstehen und zu beschriften.

This illustration shows the various ways that data can be encoded for display, and aligns them to a comprehension scale indicating how precisely the human eye can discern differences
Abbildung 1-1. Diese Abbildung zeigt die verschiedenen Arten, wie Daten für die Anzeige kodiert werden können, und ordnet sie einer Verständnisskala zu, die angibt, wie genau das menschliche Auge Unterschiede erkennen kann

In unserem ersten Anwendungsfall werden wir untersuchen, wie man effektive Balkendiagramme erstellt . Du schlüpfst in die Rolle eines großen Finanzinstituts, das verstehen möchte, welche Händlerkategorien den Großteil der Transaktionsausgaben ausmachen, um Marketingmaßnahmen und Partnerschaften zu fördern und die Interessen der Kunden besser zu bedienen. Wir werden auch über die Standardvorgaben hinausgehen und zwei zusätzliche Methoden zur Erstellung von Balkendiagrammen lernen, die die wichtigsten Informationen zeigen.

In der zweiten Fallstudie lernst du, wie du mit vielen Dimensionen arbeiten kannst. Während Balkendiagramme sehr nützlich sind, brauchst du für kategoriale Analysen andere Datenvisualisierungswerkzeuge. Wenn eine Dimension viele Mitglieder hat, ist es manchmal problematisch, jedes einzelne in einem Balkendiagramm darzustellen. In diesem Fall kannst du alternative Diagrammformen verwenden, um Platz zu sparen und trotzdem alle Mitglieder anzuzeigen. Das nützlichste Diagramm für dieses Szenario ist eine Baumkarte. In dieser Fallstudie über eine gemeinnützige Organisation werden wir uns mit Treemaps beschäftigen.

In unserem letzten Anwendungsfall dieses Kapitels lernst du, wie du Torten- und Donut-Diagramme verwenden kannst, um ganze Zusammenhänge zu visualisieren. In dieser Fallstudie geht es um eine Umfrage über IT-Fachkräfte und psychische Gesundheit. Tortendiagramme sind oft die erste Art der Datenvisualisierung, die du in der Schule lernst, aber wir verwenden sie gerne sparsam und als alternative Option. Wenn wir zu diesem Anwendungsfall kommen, wirst du sehen, wie gut Tortendiagramme geeignet sind, um Daten zu erstellen und mit deinem Publikum zu teilen.

Balkendiagramme: Banco de Tableau Fallstudie

In unserer ersten Fallstudie geht es um ein großes Finanzinstitut, das versucht, das Verhalten der Verbraucher zu verstehen. Wir nennen es Banco de Tableau( kurz:BoT ).

Das Datenteam bei BoT arbeitet daran, zu verstehen, wie und wo die Verbraucher ihr Geld ausgeben. Dieses Ziel ist für den Erfolg des Unternehmens von grundlegender Bedeutung, denn es wird die Richtung der Marketingbemühungen, Partnerschaften und Produktwerbung bestimmen. Es wird auch Einblicke in die Erstellung von Kundenprofilen geben und vielleicht sogar Möglichkeiten aufzeigen, den Kundenstamm zu vergrößern. Welche Art von Diagramm sollte das Team verwenden, um seine Ergebnisse zu präsentieren?

Balkendiagramme sollten die erste Visualisierungsart sein, die du ausprobierst, wenn du dich mit kategorialen Analysen beschäftigst. Da sie Länge und Höhe als visuelle Kodierung verwenden, lassen sich die Mitglieder leicht interpretieren und vergleichen.

Um das Problem des Bankdatenteams zu lösen, wirst du mit einem einfachen Balkendiagramm beginnen. Damit kannst du die Arten von Händlern danach vergleichen, wie viel die Verbraucher ausgeben. Außerdem dient es als erster Schritt zum Verständnis der Daten.

Strategie: Erstelle ein Balkendiagramm in Tableau

Um dein erstes Balkendiagramm zu erstellen, verwendest du den Datensatz "Transaktionen von Finanzinstituten", dem du in Tableau folgst. Hier sind die Schritte:

  1. Ziehe die Dimension [Händlerkategorie] in das Regal "Zeilen".

  2. Ziehen Sie die Kennzahl [Transaktionsbetrag] in das Spaltenregal als SUM([Transaction Amount]).

  3. Sortiere die Händler in der Symbolleiste in absteigender Reihenfolge nach Transaktionsbetrag (auch Ausgaben genannt).

Glückwunsch - du hast dein erstes Balkendiagramm erstellt. Das mag jetzt nicht revolutionär erscheinen, aber es ist der erste Schritt, um herauszufinden, wo die Verbraucherausgaben konzentriert sind. Dieses einfache Diagramm, das in Abbildung 1-2 dargestellt ist, widerlegt alle auf Intuition basierenden Theorien und präsentiert uns die Fakten.

A bar chart showing the merchant categories sorted in descending order by transaction amount
Abbildung 1-2. Ein Balkendiagramm, das die Händlerkategorien in absteigender Reihenfolge nach Transaktionsbetrag sortiert zeigt

Das ist ein guter Ausgangspunkt. Wir haben die Daten nun visualisiert und können sehen, dass die größte Händlerkategorie Männer- und Frauenbekleidungsläden sind. Wir können auch sehen, dass mehrere kleine Händlerkategorien nicht für viele Ausgaben verantwortlich sind, wie z.B. Reinigung und Wartung. Das Wissen, dass es viele Arten von Händlerkategorien gibt und dass einige viel größer sind als andere, ist eine zusätzliche Erkenntnis, die wir nutzen können, um unsere Visualisierung zu verbessern.

Eine gute Möglichkeit, dies schrittweise zu tun, besteht darin, die Anzahl der sichtbaren Händlerkategorien zu begrenzen, indem du einen Top N-Filter mit einem Parameter verwendest. Dieser Filter begrenzt das Diagramm um die definierte Zahl N, um nur die Top-Mitglieder im Diagramm anzuzeigen. Ein Parameter ist ein dynamisches Eingabefeld, das vom Endnutzer definiert wird.

In diesem Szenario werden wir einen Parameter erstellen, mit dem der Nutzer dynamisch die Anzahl der Kategorien festlegen kann, die er sehen möchte. Mit dem Parameter haben wir nicht nur mehr Kontrolle über die Visualisierung, sondern können den Inhalt des Diagramms auch auf eine sympathischere Art verstehen. Eine Top-10-Darstellung ist viel greifbarer und mundgerechter als eine lange Liste von Balken.

Tipp

In der kommenden Strategie wirst du zum ersten Mal mit einem Parameter arbeiten. Wir verwenden die Eselsbrücke ABC, um uns an die häufigsten Schritte zur Erstellung eines Parameters zu erinnern:

  • A: Füge einen neuen Parameter hinzu.

  • B: Bringe die Parametersteuerung auf dein Arbeitsblatt (zeige die Steuerung).

  • C: Nimm den Parameter in ein berechnetes Feld auf.

Strategie: Ein Top N Balkendiagramm erstellen

Um das Top N-Balkendiagramm zu erstellen, befolge diese Schritte:

  1. Ziehe [Händlerkategorie] in das Regal "Filter".

  2. Navigiere zum oberen Abschnitt.

  3. Wähle aus der Dropdown-Liste die Option Neuen Parameter erstellen.

  4. Benenne den Parameter [Top N] und speichere ihn.

  5. Klicke mit der rechten Maustaste auf den Parameter unten links im Datenfenster, um die Parametersteuerung zu öffnen.

Beachte in Abbildung 1-3, dass wir den Parameterwert in den Titel des Diagramms gesetzt haben. Wenn der Nutzer nun eine dynamische Änderung vornimmt, wird die Zahl als Reaktion darauf aktualisiert. Mit dieser kleinen Maßnahme haben wir ein Portfolio von Diagrammen erstellt, das an die Bedürfnisse des Publikums angepasst werden kann. Durch diese Änderung reagiert das Diagramm auch auf das Publikum; seine Aktionen verändern die Visualisierung.

A bar chart with Top N filtering and a parameter applied
Abbildung 1-3. Ein Balkendiagramm mit Top N-Filterung und einem angewandten Parameter

Wie können wir also einen Schritt weiter gehen? Wir vermuten, dass du dich gefragt hast, welchen Anteil jede dieser Kategorien am Gesamtumsatz hat. Ein Vergleich ist zwar nützlich, wenn wir versuchen, unsere Überlegungen zusammenzufassen, aber es liegt nahe, den Kommentar "Die Ausgaben der Kunden entfallen auf Herren- und Damenbekleidungsgeschäfte in Höhe von 27 Millionen US-Dollar" in "Fast 4 % aller Kundenausgaben entfallen auf Herren- und Damenbekleidungsgeschäfte" zu ändern.

Wie können wir diese Informationen darstellen? Zunächst einmal können wir die Messgröße von einer direkten Messung in einen prozentualen Anteil an der Gesamtsumme ändern. Aber wenn wir uns auf die Top 10 beschränken, verlieren wir den Überblick darüber, wie viel in den anderen Kategorien ausgegeben wird.

Um diese Einschränkung zu umgehen, können wir dem Publikum die Möglichkeit geben, über einen Parameter den Anteil der Kundenausgaben zu definieren, der auf die Händlerkategorien aufgeteilt werden soll, und alle anderen Kategorien automatisch zusammenzufassen. Sie haben immer noch die dynamische Kontrolle über das Diagramm, erhalten aber ein vollständiges Bild der Daten, wie in Abbildung 1-4 dargestellt.

Beachte, dass du eine Berechnung erstellen musst, die der Berechnung des Prozentsatzes der Gesamtsumme entspricht. Auf kannst du dazu Level-of-Detail-Ausdrücke(LOD) verwenden. Mit einem LOD-Ausdruck kannst du die Aggregation der Berechnung festlegen, unabhängig von den Dimensionen, die in der Visualisierung verwendet werden. Bei dieser Berechnung wird die Zahl SUM([Transaction Amount]) durch die Gesamtzahl SUM([Transaction Amount]) des gesamten Datensatzes geteilt.

The updated bar chart, now with All Other Categories grouped at the bottom
Abbildung 1-4. Das aktualisierte Balkendiagramm, jetzt mit allen anderen Kategorien am unteren Rand gruppiert

Strategie: Andere Dimensionen dynamisch gruppieren

Um unser Diagramm zu aktualisieren, um andere Dimensionen dynamisch zu gruppieren und den prozentualen Anteil an der Gesamtsumme anzuzeigen, befolge diese Schritte und verwende das Arbeitsblatt aus der vorherigen Strategie:

  1. Entferne den Filter [Händlerkategorie] aus dem Regal "Filter", indem du mit der rechten Maustaste klickst und "Entfernen" auswählst oder indem du ihn in den grauen Bereich unter der Markierungskarte ziehst.

  2. Ändere die Kennzahl in einen Prozentsatz der Gesamtsumme, indem du die Tabellenkalkulationen verwendest. Klicke mit der rechten Maustaste auf SUM([Transaction Amount]) und wähle Quick Table Calculations → Percentage of Total.

  3. Erstelle einen Parameter namens [Percentage Threshold]. Setze den Datentyp auf einen Float mit 0,01 als aktuellem Wert. Zeige das Zahlenformat als Prozentsatz an.

  4. Erstelle ein Set basierend auf der Dimension [Händlerkategorie]. Dabei handelt es sich um ein Formelset, das auf der Berechnung basiert, dass der Prozentsatz der Gesamtsumme größer oder gleich dem Parameter ist. Klicke mit der rechten Maustaste auf [Händlerkategorie] im Datenbereich und wähle Erstellen → Set.

  5. Wähle im Dialogfeld "Set erstellen" die Option "Alle verwenden", navigiere dann zur Registerkarte "Bedingung" und gib in das Textfeld "Nach Formel" Folgendes ein:

    SUM([Transaction Amount])/MAX({SUM([Transaction Amount])})
    	>= [Percentage Threshold]
  6. Erstellen Sie eine berechnete Dimension namens [Merchant Category to Display]:

    //Merchant Category to Display
    IF [Merchant Category Set] THEN [Merchant Category]
    ELSE "All Other Categories" END
  7. Ziehe die neue Dimension [anzuzeigende Händlerkategorie] über die Dimension [Händlerkategorie] in der Ablage "Zeilen".

  8. Ziehe [Händlerkategorien-Set] auf die linke Seite von [anzuzeigende Händlerkategorie]. Dadurch wird die Auflistung der Kategorien organisiert. Klicke mit der rechten Maustaste und blende die Kopfzeile aus.

  9. Beende die Visualisierung, indem du mit der rechten Maustaste klickst und den Parameter [Prozentschwelle] zum Blatt hinzufügst. Klicke außerdem mit der rechten Maustaste und blende die Feldüberschrift für [anzuzeigende Händlerkategorie] aus. Füge Beschriftungen hinzu, indem du auf der Karte Markierungen auf Beschriftung klickst und das Kontrollkästchen "Beschriftungen anzeigen" aktivierst.

Die aktualisierte Analyse passt sich viel flexibler an die Vorlieben des Publikums an. Jetzt haben sie kontextbezogene Informationen über den prozentualen Anteil an der Gesamtsumme und können selbst bestimmen, wie viele Daten angezeigt werden. Diese Visualisierung ist dem Balkendiagramm mit der Summe der Ausgaben einen Schritt voraus, weil wir nicht mehr auf die Kenntnis der Gesamtverteilung der Daten verzichten müssen.

Wenn du diesen Punkt erreicht hast und immer noch mehr willst, kannst du zusätzliche Elemente einführen, um noch mehr Kontext und Feedback hinzuzufügen. Ähnlich wie bei unserem ursprünglichen Parameter für Top N geben diese zusätzlichen Techniken dem Publikum Feedback, wie das Diagramm auf seine Eingaben reagiert, und tragen dazu bei, sein Vertrauen in das Diagramm zu stärken.

Strategie: Verbessere dein Balkendiagramm mit Farbe

Eine Ergänzung, die du an deinem Balkendiagramm vornehmen kannst, ist die Farbe. Befolge diese Schritte für diese Erweiterung:

  1. Du kannst den Parameter als Referenzlinie verwenden, um das Konzept der dynamischen Eingabe zu verdeutlichen. Klicke mit der rechten Maustaste auf die Achse [% des gesamten Transaktionsbetrags] und wähle Referenzlinie hinzufügen. Setze den Geltungsbereich auf die gesamte Tabelle, den Wert auf die prozentuale Schwelle und die Beschriftung auf den Wert. Klicke auf OK.

  2. Stelle nun die prozentuale Schwelle auf 0,75% (0,0075) ein. Beachte, dass zusätzliche Kategorien angezeigt werden, aber keine weniger als 0,75% ist.

  3. Du kannst die großen Händlerkategorien auch weiter kodieren, indem du unser Set für Farben verwendest. Ziehe [Händlerkategorien-Set] auf Farbe. Die Händler, die im Set enthalten sind, werden in einer Farbe angezeigt, während die Händler, die nicht im Set enthalten sind und zu "Alle anderen Kategorien" gehören, in einer anderen Farbe erscheinen.

    Abbildung 1-5 zeigt das Ergebnis.

The same bar chart, now with color encoding to distinguish between the individual categories and the grouped category
Abbildung 1-5. Das gleiche Balkendiagramm, jetzt mit Farbkodierung zur Unterscheidung zwischen den einzelnen Kategorien und der gruppierten Kategorie

Gut gemacht! Wir lieben Balkendiagramme - sie sind ein wichtiges Instrument für jede Analyse. Auch wenn sie anfangs sehr einfach sind, kannst du ein Balkendiagramm durch abstrahierte Metriken und dynamische Einträge von einfach zu beeindruckend machen.

Manchmal liegt der Wert in der Art und Weise, wie du den Text in und um diese Balkendiagramme herum formatierst. In diesem Abschnitt zeigen wir dir drei weitere Möglichkeiten, wie du deine Balkendiagramme mit Formatierungen aufpeppen kannst. Du wirst weiterhin den Datensatz "Transaktionen von Finanzinstituten" verwenden, um zu erstellen.

Strategie: Text linksbündig ausrichten

Du beginnst mit einem neuen Arbeitsblatt und erstellst mit Network dieses formatierte Balkendiagramm:

  1. Füge [Netzwerk] zum Regal "Zeilen" und SUM([Transactions]) zum Regal "Spalten" hinzu. Setze die Ansicht auf Gesamtansicht und benutze das Sortiersymbol auf der Achse, um die Netzwerke in absteigender Reihenfolge nach SUM([Transactions]) zu sortieren.

  2. Füge [Netzwerk] und SUM([Transactions]) zu Label auf der Markierungskarte hinzu, indem du die Strg-Taste gedrückt hältst und die beiden aus dem jeweiligen Regal Zeilen/Spalten ziehst.

  3. Klicke mit der rechten Maustaste auf [Netzwerk] in der Ablage "Zeilen" und deaktiviere "Kopfzeile anzeigen".

  4. Um das Etikett zu bearbeiten, klicke auf der Karte Markierungen auf Etikett. In dem sich öffnenden Dialogfeld klickst du auf die Ellipse neben der Option Text. Ändere die Beschriftung so, dass sie <Network> // <SUM(Transactions)> und linksbündig sein. Wir empfehlen, die Schriftgröße der Dimension etwa 1,5 Mal so groß wie die Schrift der Maßnahme einzustellen. Dies kannst du erreichen, indem du <Netzwerk> auf 12 und <SUMME(Vorgänge)> auf 10 setzt.

  5. Klicke erneut auf Etikett und stelle die horizontale Ausrichtung auf Links ein.

  6. Klicke mit der rechten Maustaste auf die Achse und entferne die Option Kopfzeile anzeigen, um die Achse für [Transaktionen] auszublenden.

  7. Wähle in der Werkzeugleiste Format → Linien. Entferne die Rasterlinien und die Nulllinien, indem du sie auf Keine setzt. Setze die Achsenlineale der Zeilen auf einfarbig schwarz.

Das Ergebnis ist eine Visualisierung mit Beschriftungen, die den Dimensionsnamen und den mit der Maßnahme verbundenen Wert enthalten(Abbildung 1-6).

Reformatting a bar chart can bring new life to the chart type
Abbildung 1-6. Die Neuformatierung eines Balkendiagramms kann dem Diagrammtyp neues Leben einhauchen.

Strategie: Balken mit Etiketten oben erstellen

Diese Strategie platziert auch Beschriftungen und die Werte direkt über den Balken. Der Trick bei der Erstellung dieses Balkendiagramms ist, dass wir den Markierungstyp Balken überhaupt nicht verwenden:

  1. Klicke mit der rechten Maustaste auf das Arbeitsblatt aus der vorherigen Strategie und dupliziere es.

  2. Erstellen Sie eine Berechnung namens [Baseline]. Diese Berechnung wird verwendet, um die Basisposition der Balkendiagramme festzulegen:

    //Baseline
    MIN(0.0)
  3. Füge [Grundlinie] zum Regal Spalten hinzu. Klicke mit der rechten Maustaste und erstelle eine Doppelachse. Synchronisiere die Achse und ändere dann den Markierungstyp in Gantt. Blende die Achse aus, indem du mit der rechten Maustaste klickst und die Option Kopfzeile anzeigen deaktivierst. Eventuell musst du die Markierungsart von SUM([Transactions]) wieder in Balken ändern. Deaktiviere dabei auch das Kontrollkästchen "Markierungsbeschriftungen anzeigen".

  4. Bearbeite auf der Karte Markierungen für [Baseline] die Breite des Gantt-Diagramms, indem du auf Größe klickst und den Schieberegler so anpasst, dass die Gantt-Balken so breit wie möglich sind. Ändere die Farbe auf Weiß und setze die Deckkraft auf Null.

  5. Stelle die Ausrichtung des Etiketts so ein, dass es horizontal rechtsbündig und vertikal oben ist.

  6. Jetzt kannst du die Größe des SUM([Transactions]) Balkens so anpassen, dass er kleiner ist und die Beschriftungen der Gantt-Marke über dem Balken liegen. Abbildung 1-7 zeigt das neu formatierte Diagramm.

Another reformatted bar chart
Abbildung 1-7. Ein weiteres neu formatiertes Balkendiagramm

Strategie: Erstelle ein Prozent-vom-Maximum-Balkendiagramm

Für erstellst du in diesem Beispiel ein weiteres Balkendiagramm(Abbildung 1-8), aber dieses Mal wird auch der Hintergrund des Balkens farblich hervorgehoben:

  1. Erstellen Sie eine Berechnung namens [Total Bar]:

    // Total Bar
    MIN(1.0)
    Tipp

    Wir verwenden diese Berechnung, um 100% des Transaktionsbetrags in der Visualisierung darzustellen.

  2. Füge [Netzwerk] zum Regal "Zeilen" hinzu.

  3. Füge [Gesamtbalken] zum Regal "Spalten" hinzu. Lege fest, dass die Achse bei 0 beginnt und bei 1,1 endet. Dazu klickst du mit der rechten Maustaste auf die Achse und wählst Achse bearbeiten. Im Dialogfeld stellst du den Bereich auf fest ein und wählst 0 als festen Anfang und 1,1 als festes Ende.

  4. Setze die Farbdeckkraft auf 40%. Ziehe SUM([Transactions]) auf Label.

  5. Erstellen Sie eine Maßnahme namens [Percent of Maximum]:

    // Percent of Maximum Transactions
    SUM([Transactions])/WINDOW_MAX(SUM([Transactions]))
  6. Füge diese neue Kennzahl zum Regal Spalten hinzu. Erstelle eine Doppelachse und synchronisiere die Achsen. Möglicherweise musst du die Markierungstypen wieder in Balken ändern. Entferne auf allen Markierungskarten die Option [Name der Maßnahme] aus der Farbe. Entferne die Beschriftung von der Markierungskarte [Prozent der maximalen Vorgänge].

  7. Sortiere die Netzwerke, indem du auf die Achse klickst und absteigende Reihenfolge auswählst. Blende dann beide Achsenüberschriften aus. Passe die Größe der Balkendiagramme so an, dass sie sich in der Mitte des Häkchens bei Größe befinden.

A percent-of-maximum bar chart
Abbildung 1-8. Ein Balkendiagramm in Prozent des Maximums

Bar-on-Bar-Charts: Amplify Performance Fallstudie

Unsere nächste Fallstudie befasst sich mit einer gemeinnützigen Organisation, Amplify Performance (AP), die Zuschussgelder für kreative, darstellende und kulturelle Kunstprogramme und Initiativen im Bundesstaat New York kontrolliert und vergibt. Die Zuschussgelder sind in zwei Kategorien unterteilt: Die eine bezieht sich auf das Budget der Organisation und die andere auf die Initiativen der Programme. Das AP-Datenteam hat versucht, beide Arten mit nebeneinander liegenden Balkendiagrammen darzustellen, aber die Ergebnisse waren verwirrend. Welche Art der Visualisierung würde besser funktionieren?

Nicht für alle kategorialen Vergleiche ist ein einfaches Balkendiagramm erforderlich. Manchmal sind die Vergleiche komplexer. So kann es zum Beispiel sein, dass du Gruppen anhand einer einzigen Kennzahl vergleichen musst, aber über zwei verschiedene Zeiträume hinweg. Dein Publikum wird die Veränderungen zwischen den Mitgliedern verstehen wollen, aber auch, wie sich einzelne Gruppen im Laufe der Zeit verändert haben.

Der erste Instinkt von unerfahrenen Entwicklern ist in solchen Situationen oft, ein nebeneinander liegendes Balkendiagramm zu verwenden. Diese können zwar effektiv sein, aber sie nehmen viel Platz weg. Bei dieser Art von Analyse bevorzugen wir stattdessen ein Balken-an-Balken-Diagramm. In Abbildung 1-9 siehst du die Gesamtzahl der Fördermittel für 2018 und 2019 für jede Kategorie in einem Balkendiagramm nebeneinander.

Side-by-side bar charts are effective but take up too much space
Abbildung 1-9. Nebeneinander angeordnete Balkendiagramme sind effektiv, nehmen aber zu viel Platz ein

Es sieht so aus, als hättest du alle Informationen, die du wirklich willst: Es gibt Balken für zwei Jahre, und du kannst schnell vergleichen. Aber du wirst feststellen, dass die Daten nicht nach der Gesamtzahl für 2019 sortiert sind, sondern nach der Gesamtzahl für die beiden Jahre.

Außerdem muss das Publikum bei Vergleichen innerhalb einer Gruppe (z. B. kulturelle Bildung) im Kopf rechnen, um die Größenordnung der Veränderung von 2018 auf 2019 zu verstehen. Es wäre toll, wenn diese Information direkt in der Visualisierung zu sehen wäre. Außerdem wäre es hilfreich, wenn das Publikum schnell erkennen könnte, welche Kategorien im Vergleich zum Vorjahr gestiegen und welche gesunken sind.

Das alles kannst du mit einem Balkendiagramm machen, wie in Abbildung 1-10 gezeigt. Folge diesem Beispiel, um es mit dem Datensatz Nonprofit Grant Data zu erstellen.

A bar-on-bar chart is a better alternative to the side-by-side bar chart because it takes up less space while displaying the same information
Abbildung 1-10. Ein Balken-auf-Balken-Diagramm ist eine bessere Alternative zum nebeneinander liegenden Balkendiagramm, da es weniger Platz benötigt, aber die gleichen Informationen anzeigt

Strategie: Einen Bar-on-Bar-Chart erstellen

In Abbildung 1-10 haben wir die Zuschusssummen für 2019 über für jede Kategorie die Zuschusssummen für 2018 eingefügt. So kann dein Publikum die Gruppen im Basisjahr, in diesem Fall 2019, schnell vergleichen und sehen, wie diese Gruppe im Vergleich zum Vorjahr abgeschnitten hat.

Um den Vergleich zwischen den Jahren zu erleichtern, haben wir Farbe hinzugefügt - wir haben nicht zwei verschiedene Farben gewählt, sondern zwei Farben mit demselben Farbton. Summen, die im Vergleich zum Vorjahr gesunken sind, werden mit einer helleren, weniger gesättigten Version der Farbe dargestellt, die verwendet wird, um Summen anzuzeigen, die im Vergleich zum Vorjahr gestiegen sind.

Schließlich haben wir die prozentuale Veränderung gegenüber dem Vorjahr neben der Gesamtsumme für 2019 hinzugefügt. Das Ergebnis in Abbildung 1-10 ist ein Diagramm, das drei Vergleiche zusammenfasst: die Gesamtsumme der Fördermittel in den einzelnen Gruppen für 2019, die Veränderungen der Gesamtsumme der Fördermittel von 2018 auf 2019 für jede Gruppe und die Veränderungen der Größenordnung von 2018 auf 2019.

Wie erstellst du also diese Tabelle? Befolge diese Schritte:

  1. Erstelle deine Kennzahlen. Anstatt eine Datumsdimension zu verwenden, um deine Daten aufzuteilen, ist es effektiver, zwei separate Berechnungen zu erstellen, die nach den relevanten Daten innerhalb der Berechnung filtern. Lass uns eine Berechnung für die Förderbeträge im Jahr 2018 erstellen:

    // Grant Amount | 2018
    SUM(
     IF YEAR([Date]) = 2018
     THEN [Grant Amount]
     END
    )

    Und eine Berechnung für die Zuschussbeträge im Jahr 2019:

    // Grant Amount | 2019
    SUM(
     IF YEAR([Date]) = 2019
     THEN [Grant Amount]
     END
    )

    Generell solltest du vermeiden, irgendetwas innerhalb von Berechnungen fest zu kodieren. In diesem Fall würden wir normalerweise Berechnungen oder Parameter verwenden, um Änderungen zu automatisieren, wenn die Daten aktualisiert werden. (Wir werden das in Kapitel 4 genauer besprechen.)

  2. Erstelle die Basisvisualisierung, indem du [Budgetkategorie] zu Zeilen und sowohl [Zuschussbetrag | 2018] als auch [Zuschussbetrag | 2019] zu Zeilen hinzufügst.

    1. Erstelle ein synchronisiertes Zwei-Achsen-Diagramm mit beiden Markierungstypen als Balken. Achte darauf, dass 2018 die äußerste linke Dimension in der Doppelachse ist.

      Ändere die Größe des 2019er Lenkers so, dass er schmaler ist als der 2018er Lenker. Es kann sein, dass du beides anpassen musst, um deine Lenker in eine gute Position zu bringen.

    2. Achte darauf, dass du [Measure Names] aus beiden Marks-Karten entfernst. (Du hast dies nicht hinzugefügt; Tableau hat dies automatisch getan, als du ein zweiachsiges Diagramm erstellt hast).

    3. Setze die Farbe der äußeren Leiste auf ein helles Grau, das sich noch vom Hintergrund abhebt, wie in Abbildung 1-11 gezeigt.

    Use a dual axis with custom calculations to create bar-on-bar charts
    Abbildung 1-11. Verwenden Sie eine Doppelachse mit benutzerdefinierten Berechnungen, um Balken-an-Balken-Diagramme zu erstellen
    Tipp

    Wir ziehen es vor, dass die Breite der äußeren Balken (in Abbildung 1-11, 2018) der Breite des Leerraums zwischen den Balken entspricht. Die Breite der inneren Balken sollte zwischen 50% und 75% der Breite der äußeren Balken liegen.

  3. Wir könnten uns auf die Achsen für Vergleiche verlassen, aber da wir ein horizontales Balkendiagramm verwenden, ist es sinnvoll, Beschriftungen hinzuzufügen:

    1. Klicke auf die Karte [Zuschussbetrag | 2019] und ziehe [Zuschussbetrag | 2019] auf Etiketten.

    2. Erstellen Sie eine neue Berechnung namens [Grant Amount | % Change] für die prozentuale Veränderung von 2018 auf 2019:

      // Grant Amount | % Change
      ([Grant Amount | 2019] - [Grant Amount | 2018]) / [Grant Amount | 2018]
    3. Nachdem du die Maßnahme erstellt hast, klickst du mit der rechten Maustaste darauf und änderst die Standardeinstellungen für das Zahlenformat, wie in Abbildung 1-12 gezeigt.

      Use custom formatting to get your percentage displays just right
      Abbildung 1-12. Verwende die benutzerdefinierte Formatierung, um deine Prozentanzeigen genau richtig zu machen

      Dadurch wird ein Pluszeichen vor den positiven Werten, ein Minuszeichen vor den negativen Werten und kein Zeichen angezeigt, wenn es keine Richtungsänderung gibt.

    4. Füge diese Berechnung auch dem Etikett hinzu. Bearbeite nun den Text der Beschriftung. Formatiere [Zuschussbetrag | 2019] so, dass er sowohl größer als auch dunkler ist als das Maß [Zuschussbetrag | % Veränderung]. Dein Diagramm sollte wie Abbildung 1-13 aussehen.

      The text editor showing how you should format the text labels on the visualization
      Abbildung 1-13. Der Texteditor zeigt, wie du die Textbeschriftungen auf der Visualisierung formatieren solltest

      In diesem Beispiel verwenden wir die Schriftgröße 15 bzw. 9. Die Textfarben sind #000000 (schwarz) und #555555 (dunkelgrau). Außerdem haben wir [Grant Amount | % Change] zwischen Klammern eingefügt. Dein Diagramm sollte wie Abbildung 1-14 aussehen.

      A look at the bar-on-bar chart before we finalize formatting
      Abbildung 1-14. Ein Blick auf den Bar-on-bar-Chart, bevor wir die Formatierung abschließen
  4. Um Farbe hinzuzufügen, erstelle einen einfachen Booleschen Wert namens [Color] der 2019 mit 2018 vergleicht, und füge ihn dann der Karte [Zuschussbetrag | 2019] hinzu:

    // Color
    
    [Grant Amount | 2019] > [Grant Amount | 2018]

    Du kannst die Farbe bearbeiten und zwei Farben auswählen, die mit der gleichen Farbe beginnen: zum Beispiel die Basis-Hex-Farbe #19626B für Werte, die wahr sind, und eine zweite Farbe, #84B6BC, die heller und weniger gesättigt ist.

  5. Füge den letzten Schliff hinzu:

    1. Sortiere deine Kategorien nach der Gesamtsumme der Zuschüsse im Jahr 2019.

    2. Blende deine Achsen und Zeilenkopfbeschriftungen aus. Entferne alle zusätzlichen Zeilen.

    3. Entferne deine vertikale Trennwand. Behalte deine horizontale Trennwand, aber achte darauf, dass sie jedes Mitglied trennt.

    Dein Ergebnis sollte wie Abbildung 1-15 aussehen.

The bar-on-bar chart after adding color
Abbildung 1-15. Das Balken-auf-Balken-Diagramm nach dem Hinzufügen der Farbe

Treemaps: Amplify Performance Fallstudie

Eine Treemap ( ) ähnelt einem Balkendiagramm, verwendet aber die Fläche eines Rechtecks im Verhältnis zur Höhe oder Länge, um Daten zu kodieren. Wenn du viele Mitglieder einer Dimension hast und alle Mitglieder anzeigen musst, ist eine Baumkarte eine gute Alternative zu einem Balkendiagramm.

Die Fläche ist ein weniger präzises Maß, aber bei der Arbeit mit Baumkarten geht es oft nicht darum, ganz genau zu sein, sondern vielmehr darum, alle Mitglieder einer Kategorie in einer einzigen, kompakten Visualisierung anzuzeigen, die vom größten zum kleinsten sortiert ist.

Einer der Hauptvorteile, den wir mit Baumdiagrammen erkunden werden, ist die Möglichkeit, eine Maßnahme oder eine Dimension farblich darzustellen. In dem Beispiel mit der drillbaren Baumstruktur werden wir sowohl die Budgetkategorien als auch die darin enthaltenen Programmkategorien farblich darstellen. Anschließend zeigen wir, wie man dem Publikum auf Wunsch zusätzliche detaillierte Mitglieder anzeigen kann. Mit dieser Funktion kann das Publikum mehrere Facetten erkunden, ohne überwältigt zu werden. Wir werden die Farbe auch als direkte und indirekte Maßnahme darstellen .

Als Nächstes befassen wir uns mit der Frage, was du tun kannst, wenn du alle Mitglieder einer Dimension in einer einzigen Visualisierung anzeigen musst. Du hast das Problem des langen Scrollens bei der Verwendung eines Balkendiagramms bereits gesehen. Welchen Diagrammtyp kannst du also verwenden, um dieses Hindernis zu umgehen?

Stell dir vor, du arbeitest für die bereits vorgestellte gemeinnützige Organisation AP, die Zuschussgelder für kreative, darstellende und kulturelle Programme und Initiativen im Staat New York verwaltet und vergibt. Die Zuschussgelder sind in zwei Kategorien unterteilt: die eine konzentriert sich auf das Budget der Organisation und die andere auf die Initiativen der Programme.

In diesem Szenario kannst du nicht auf kleine Mitglieder verzichten. Die Einsicht in einige der kleineren Kategorien ist wichtig, um herauszufinden, wohin zusätzliche Fördergelder fließen sollten.

Wenn du mit einem ähnlichen Szenario konfrontiert bist, empfehlen wir dir eine Treemap. Du verlierst zwar etwas an Präzision beim Vergleich der von dir gewählten Dimension, aber du erhältst eine übersichtliche und kompakte Darstellung, die alle Mitglieder deiner Dimension zeigt.

Strategie: Eine grundlegende Treemap erstellen

Erstelle ein neues Arbeitsblatt mit dem Datensatz "Gemeinnützige Zuschüsse" und befolge dann die folgenden Schritte:

  1. Ziehe [Budgetkategorie] auf Text.

  2. Ziehe SUM([Grant Amount]) auf Größe und bei gedrückter Strg-Taste auch auf Farbe.

  3. Vergewissere dich, dass der Markierungstyp auf Quadratisch eingestellt ist.

    Das Ergebnis ist in Abbildung 1-16 dargestellt.

A treemap showing the budget categories ordered by grant amount
Abbildung 1-16. Eine Baumstruktur mit den Budgetkategorien, geordnet nach Förderhöhe

So bekommst du einen vollständigen Überblick über die Verteilung der AP-Zuschüsse. Keine einzelne Haushaltskategorie hat einen großen Anteil an der Finanzierung, aber einige kleinere Kategorien machen weniger als 1 % aus.

Tipp

Die Standardkonvention bei der Arbeit mit Baumdiagrammen ist die doppelte Codierung einer Maßnahme durch Größe und Farbe. Das hilft dabei, die Stücke und Mitglieder besser zu unterscheiden. Es ist aber keine Voraussetzung. Alternativ könntest du die Kategorien auch farblich kodieren. Wir raten jedoch zur Vorsicht: Es gibt viele Mitglieder und in diesem Fall würdest du redundante Informationen kodieren.

Diese Übersicht ist ein guter Anfang, aber sie gibt uns nur halbwegs Aufschluss über die Förderdaten. Die Gelder werden nicht nur auf die Budgets aufgeteilt, sondern auch den Programmkategorien zugewiesen. Es gibt 55 verschiedene Programmkategorien, eine erhebliche zusätzliche Detailebene, die überwältigend sein könnte. Wir müssen wirklich nur wissen, welchen Programmkategorien die Mittel innerhalb einer bestimmten Budgetkategorie zugewiesen sind.

Um die Frage nach den Programmkategorien innerhalb der Budgets zu klären, kann das AP-Team eine drillable treemap erstellen: eine interaktive Baumkarte, in der das Publikum eine bestimmte Budgetkategorie anklicken kann, um weitere Informationen zu erhalten.

Hinweis

In der folgenden Strategie wirst du Set-Aktionen verwenden. Mit Sets und Set-Aktionen können deine Endnutzer mit Visualisierungen interagieren, um Dimensionen einem Set zuzuordnen. Sobald eine Dimension Teil eines Sets ist, werden weitere Details im gebohrten Abschnitt angezeigt.

Strategie: Drillable Treemaps erstellen

Auf kannst du eine drillbare Treemap erstellen, indem du weiterhin den Datensatz "Nonprofit Grant Data" verwendest:

  1. Ausgehend von der fertigen Baumstruktur aus der vorherigen Strategie erstellst du ein Set, das sowohl auf der [Budgetkategorie] als auch auf der [Programmkategorie] basiert, indem du zunächst die [Programmkategorie] auf die Karte "Markierungen" in der Baumstrukturansicht ziehst. So kannst du auf eine Markierung klicken und ein Set erstellen, das beide Dimensionen kombiniert. Klicke mit der rechten Maustaste auf eine beliebige Markierung und erstelle ein Set mit dem Namen [Program & Budget Set]. Es spielt keine Rolle, welche Werte das Set enthält, es muss nur zwei Spalten enthalten, eine für jede Dimension.

  2. Erstellen Sie nun ein berechnetes Feld namens [Label Program]. Dieses wird auswerten, ob etwas Teil des Sets ist und das Programm zurückgeben, wenn es das ist:

    //Label Program
    IF [Program & Budget Set] THEN [Program Category] END
  3. Ziehe dieses berechnete Feld über [Programmkategorie] auf der Karte "Markierungen".

  4. Erstelle die Drilldown-Funktionalität. Wähle Arbeitsblatt → Aktionen → Aktion hinzufügen → Sollwerte ändern.

  5. Ruf es Drill Down to Program. Sie wird auf Select ausgeführt. Das Zielset ist [Programm- und Budgetset]. Die gewünschte Aktion beim Löschen der Auswahl ist "Alle Werte aus dem Set entfernen".

  6. Ziehe [Budgetkategorie] auf Farbe und ersetze SUM([Grant Amount]).

  7. Wenn du jetzt auf Tanz klickst, werden in der Baumstruktur alle Programme angezeigt, die zum Tanzbudget gehören.

In Abbildung 1-17 siehst du, dass du den Einsatz von Farbe hier geändert hast. Anstatt die Farbe mit der Wiederholung der Fördermittelausgaben zu verbinden, verwendest du sie, um die Budgetkategorien zu unterscheiden.

A treemap showing both the budget category and program category (the treemap is colored by budget category, and the size of the rectangle represents the grant amount)
Abbildung 1-17. Eine Baumkarte, die sowohl die Budgetkategorie als auch die Programmkategorie zeigt (die Baumkarte ist nach Budgetkategorie eingefärbt, und die Größe des Rechtecks stellt den Förderbetrag dar)

Kehren wir noch einmal zu unserem Baumdiagramm-Beispiel zurück und gehen wir bei der Farbcodierung in eine weitere Richtung. In diesem Szenario beginnst du mit den Programmkategorien, um die Baumstruktur zu erstellen. In diesem Fall versucht das AP-Team nicht nur sicherzustellen, dass die verschiedenen Programmtypen eine ausreichende Verteilung der Mittel erhalten, sondern auch, dass es eine Vielfalt von Programmen gibt, die gefördert werden und unterstützt werden.

Strategie: Ein kontinuierliches Maß mit Farbe kodieren

Auf kannst du diese Visualisierung nutzen, um Möglichkeiten zur Wiederbelebung von Programmen durch Farbkodierung zu erkennen. Außerdem kannst du damit eine weitere kontinuierliche Kennzahl hervorheben: die Tage, seit denen die letzte Förderung gewährt wurde.

Ein kontinuierliches Maß ist ein Maß, das sich über einen unendlichen Bereich erstreckt, typischerweise auf einer Zahlenreihe oder Zeitachse:

  1. Erstelle auf einem neuen Arbeitsblatt eine Baumstruktur aus [Programmkategorie] und [Zuschussbetrag].

  2. Erstelle ein berechnetes Feld, das auswertet, wie lange es her ist, dass eine Förderung in einer Kategorie gewährt wurde:

    //Days Since Last Grant
    DATEDIFF( 'day',MAX([Date]),TODAY())
  3. Wenn du diese Berechnung in der Ansicht verwendest, wird das maximale oder jüngste Datum pro [Programmkategorie] ausgewertet und dann die Anzahl der Tage seit heute berechnet.

  4. Setze diese Maßnahme auf Farbe und ändere die Palette auf Blau-Grün Sequentiell umgekehrt.

    Du kannst das Ergebnis in Abbildung 1-18 sehen.

A treemap showing grant amount by program category; color has been encoded to show the number of days since the program was last funded
Abbildung 1-18. Eine Baumstruktur, die den Zuschussbetrag nach Programmkategorie anzeigt; die Farbe wurde kodiert, um die Anzahl der Tage seit der letzten Finanzierung des Programms anzuzeigen

Du hast jetzt drei Ansätze für Baumkarten gesehen, die verschiedene Farbkodierungstechniken und dynamische Elemente verwenden, die es dem Publikum ermöglichen, eine Kategorie noch tiefer zu erforschen .

Kuchen- und Donut-Diagramme: Fallstudie zum IT-Mitarbeiter-Wellness-Projekt

Unsere letzte Fallstudie in diesem Kapitel betrifft das IT Employee Wellness Project, eine Initiative, die Umfragen unter IT-Fachkräften und ihren Arbeitgebern durchführt. Das Projekt untersucht, wie sich die IT-Arbeit auf die psychische Gesundheit der Beschäftigten auswirkt und wie die Arbeitgeber über psychische Gesundheit denken.

Wie bei den meisten Umfragen gibt es viele Fragen, die analysiert werden müssen, um die Einstellungen zu ermitteln, aber eine zentrale Aufgabe ist es, einen demografischen Überblick über die Befragten zu erstellen. Das Ziel der Datenanalysten des Projekts ist es, die Geschlechterverteilung unter den Umfrageteilnehmern nach Berufen aufzuzeigen. Außerdem möchten sie diese Verteilung gleichzeitig über mehrere Berufe hinweg vergleichen. Mit welchen Diagrammtypen können sie dies den Vorstandsmitgliedern des Projekts am effektivsten vermitteln?

Wenn du eine Beziehung zwischen Teilen und dem Ganzen betrachtest, ist ein natürlicher Ausgangspunkt ein Kreisdiagramm. Ein Tortendiagramm unterteilt einen Kreis in Teile, die einer Dimension angehören, und jedes Teil stellt einen Anteil des Ganzen dar. Manche Diagrammliebhaber schrecken bei dem Gedanken an ein Kreisdiagramm zurück, aber Kreisdiagramme sind den meisten Menschen vertraut. Außerdem nutzen sie den Platz effizient und können als Farblegende oder interaktiver Filter verwendet werden. Sie sind nicht in jeder Situation die beste Wahl, aber wenn sie richtig eingesetzt werden, haben sie ihren Platz.

In unserer letzten Strategie für dieses Kapitel gehst du noch einen Schritt weiter, indem du kleine Multiplikatoren oder wiederholte Versionen desselben Diagramms erstellst, die nach Berufen getrennt sind. So kann das Datenteam die Geschlechterverteilung in mehreren Berufen gleichzeitig vergleichen.

Strategie: Erstellen eines einfachen Tortendiagramms

Beginnen wir mit dem einfachen Kreisdiagramm. Dazu verwendest du den Datensatz "IT-Umfrage":

  1. Ziehe [Geschlecht] auf Farbe.

  2. Ändere die Art der Markierung in Torte.

  3. Erstellen Sie ein berechnetes Feld namens [# Respondents].

    //# Respondents
    COUNTD([Respondent ID])
  4. Ziehe [# Respondenten] auf den Winkel. Ändere die Farben nach deinem Geschmack (wir verwenden die Sommerpalette und einen weißen Rahmen). Ziehe [Geschlecht] zusammen mit [Anzahl der Befragten] auf das Etikett. Formatiere das Etikett so, dass es mit den Farben der Markierung übereinstimmt.

    Abbildung 1-19 zeigt das Ergebnis.

A pie chart showing the distribution of gender for survey respondents
Abbildung 1-19. Ein Tortendiagramm, das die Verteilung des Geschlechts der Umfrageteilnehmer zeigt

Warum funktioniert dieses Kreisdiagramm? Erstens hat es nur drei Scheiben; dieser Kuchen hat nicht viele Teile, also ist es ziemlich einfach, die Unterschiede zu vergleichen. Außerdem hast du dir die Mühe gemacht, jedes Stück direkt zu beschriften und den Prozentsatz daneben zu setzen. Das macht es für das Publikum leicht zu verstehen. Hättest du viel mehr Werte oder mehrere Scheiben von relativ gleicher Größe, würden wir ein Balkendiagramm empfehlen, aber das ist hier eindeutig nicht der Fall .

Strategie: Erstelle eine Donut-Tabelle

Lass uns dieses Kreisdiagramm in ein Donut-Diagramm verwandeln, indem wir ein Loch in der Mitte hinzufügen. Dieses Loch ermöglicht es dir, eine zusätzliche Information zu übermitteln. In diesem Fall ermöglicht es dir, zwei Konzepte in einem einzigen Diagramm darzustellen - die Anzahl der Befragten und die Verteilung der Geschlechter:

  1. Erstelle eine Dummy-Messung [MIN(1)]Diese wird als mehrere Messgrößen für ein zweiachsiges Diagramm verwendet:

    //Dummy
    MIN(1)
  2. Ziehe sie zweimal in die Zeilen, klicke mit der rechten Maustaste und erstelle ein Zwei-Achsen-Diagramm. Du kannst die Visualisierung aus der vorherigen Strategie als Ausgangspunkt verwenden.

  3. Setze bei der ersten Maßnahme das richtige Häkchen bei der empfohlenen Größe.

  4. Klicke mit der rechten Maustaste auf [#Befragte] und ändere es in eine Prozentsatz der Gesamtsumme-Schnelltabellenberechnung. Formatiere dann den Prozentsatz so, dass er keine Dezimalstellen enthält, indem du mit der rechten Maustaste auf das Feld klickst und Format wählst.

  5. Klicke auf die zweite Maßnahme und entferne alle Felder, außer [# Befragte], das auf Etikett stehen sollte. Füge den Text Respondents in der Schriftart 8 pt. unter dem Feld ein.

  6. Mach die Größe der zweiten Maßnahme zum linken Häkchen bei der empfohlenen Größe.

  7. Richte das Etikett mittig aus und setze die Farbe der Markierung auf weiß.

  8. Blende die Achsen aus und entferne alle Linien aus dem Diagramm.

    Du kannst das Ergebnis in Abbildung 1-20 sehen.

A donut chart with the number of respondents has been added to the center; the slices represent the distribution of survey respondents by gender
Abbildung 1-20. In der Mitte wurde ein Donut-Diagramm mit der Anzahl der Befragten eingefügt; die Scheiben stellen die Verteilung der Umfrageteilnehmer nach Geschlecht dar

Jetzt hast du ein Donut-Diagramm, das zwei Zwecke erfüllt und fantastisch dazu geeignet ist, aufschlussreiche Beschreibungen zu erstellen. Du kannst sagen: "24 % der Befragten waren weiblich" und weißt sofort, wie groß die Stichprobe der Umfrage ist, damit das Publikum anhand der Ergebnisse Entscheidungen treffen kann.

Um das Donut-Diagramm zu vervollständigen, könntest du es als interaktiven Filter verwenden. Wenn ein Nutzer auf einen Ausschnitt klickt, filtert Tableau die nachfolgenden Visualisierungen. Es könnte auch als Farblegende dienen - eine, die mehr sagt als nur, dass grün männlich ist.

Strategie: Kleine Multiplikatoren schaffen

Da wir mit Dessert-Diagrammen arbeiten, möchten wir noch eine letzte Visualisierung vorstellen: das kleine Vielfache, also ein Diagramm, das in einem kleineren Format mehrfach wiederholt wird. Bei Torten- und Donut-Diagrammen sind die kleinen Vielfachen sehr mächtig. Du kannst eine Dimension mit mehreren Mitgliedern nehmen und sie verwenden, um sich wiederholende Diagramme für Vergleiche zu erstellen.

Wir wissen, dass der Projektausschuss sehen will, wie sich die Geschlechterverteilung in den Berufen verändert. Kleine Multiplikatoren können dir helfen, die Antwort schnell herauszufinden. Ja, du könntest einen Filter erstellen, um die Rolle auszuwählen, aber du bekommst mehr Einblick auf einen Blick, wenn du kleine Multiplikatoren erstellst, die die Verteilung zeigen und trotzdem die Stichprobengröße im Kontext angeben.

Ausgehend von der Donut-Tabelle, die du gerade erstellt hast, musst du nur noch ein paar Änderungen vornehmen:

  1. Entferne das Wort "Respondenten" aus dem Etikett, um Platz zu sparen.

  2. Ziehe [Berufsrolle] auf das Regal "Spalten".

    Du kannst das Ergebnis in Abbildung 1-21 sehen.

A small-multiples donut chart, which includes separating out the distribution by gender among different professions
Abbildung 1-21. Ein kleines Donut-Diagramm, das die Verteilung nach Geschlecht in verschiedenen Berufen aufschlüsselt

Nachdem du nun einige Beispiele für Kreisdiagramme gesehen hast, wirst du hoffentlich erkennen, wann es angebracht ist, sie zu verwenden - und noch wichtiger, wann sie die Datenpräsentation für dein Publikum verbessern können.

Fazit

Du hattest jetzt die Gelegenheit, verschiedene Diagrammtypen für kategoriale Analysen kennenzulernen. Du hast mit einem einfachen horizontalen Balkendiagramm begonnen und schnell gelernt, wie du ein Top-N-Diagramm erstellen kannst, um die Daten für dein Publikum auf die wichtigsten Informationen zu beschränken.

Von dort aus hast du untersucht, wie du kleine Kategorien dynamisch in einem anderen Balken gruppieren kannst, und hast deinem Publikum die Möglichkeit gegeben, den Umfang der Analyse mit einem Parameter zu definieren, mit dem sie den prozentualen Beitrag einer Kategorie festlegen können, der im Diagramm angezeigt werden soll.

Außerdem hast du dich mit der Farbkodierung von Balkendiagrammen befasst, um kategoriale Analysen hervorzuheben, und einige unserer bevorzugten Formatierungstechniken kennengelernt, mit denen du Balkendiagramme aufwerten kannst.

Als Nächstes sind wir zu unserer Fallstudie für Amplify Performance übergegangen und haben eine Treemap verwendet, um sicherzustellen, dass alle Mitglieder einer Dimension (auch wirklich kleine!) in einer Visualisierung dargestellt werden. Du hast gelernt, wie du diesen Diagrammtyp noch dynamischer gestalten kannst, indem du die Daten mit Drilldowns weiter aufteilst. Außerdem hast du Farbkodierungen verwendet und dich in Datumsberechnungen vertieft, um den Führungskräften von AP zu zeigen, welche Bereiche möglicherweise keine Mittel erhalten (wenn das Spaß gemacht hat, warte bis Kapitel 4).

Zum Abschluss des Kapitels haben wir uns mit Dessertdiagrammen beschäftigt, zuerst mit dem Kreisdiagramm und dann mit dem Donut-Diagramm. Du hast gelernt, wann du ein Kuchendiagramm sinnvoll einsetzen kannst (nicht zu viele Scheiben) und wie du das Loch in einem Donut-Diagramm nutzen kannst, um zwei Informationen auf einmal anzuzeigen.

Mit all diesen neuen Techniken bist du in der Lage, flexible, überzeugende und aufschlussreiche Visualisierungen zu erstellen, mit denen dein Publikum Fragen und Analysen dynamisch erkunden kann.

Im nächsten Kapitel führen wir dich in die quantitative Analyse ein - alle Diagramme konzentrieren sich auf verschiedene Möglichkeiten, numerische Felder darzustellen und Statistiken zu nutzen. Du nimmst die Grundlagen, die du beim Erstellen von Diagrammen gelernt hast, und wendest sie mit einer Vielzahl von Diagrammtypen an (tschüss, Balkendiagramm).

Get Tabelle Strategies now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.