Kapitel 4. Daten aus dem Alteryx Designer holen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Genauso wie es viele verschiedene Formate gibt, mit denen du Daten in den Designer einspeisen kannst, gibt es auch genauso viele Formate und Methoden, um Daten aus dem Designer auszugeben. Du kannst deine Daten in einfache Quellen wie eine CSV- oder Excel-Datei ausgeben, aber du kannst sie auch direkt in Datenbanken, Webquellen und große Datenvisualisierungstools wie PowerBI und Tableau ausgeben. Die meisten Benutzer geben ihre Daten entweder in Dateien wie Excel und CSV oder in Datenbanken wie Microsoft SQL Server aus. In diesem Kapitel erfährst du, wie du beides machen kannst.

Wie ich bereits in früheren Kapiteln erwähnt habe, ist der Designer extrem flexibel und leistungsstark und kann gut gestaltete Berichte und Ausgaben in verschiedenen Formaten erstellen, mit denen du sowohl Berichte als auch Analysen automatisieren kannst. In diesem Kapitel liegt der Schwerpunkt auf dem Werkzeug Daten ausgeben, aber ich werde noch viele weitere Werkzeuge für die Ausgabe von Daten vorstellen, die wir in den Kapiteln 9 und 10 im Detail behandeln werden.

Dateien vs. Datenbanken

Viele von uns in der Analysebranche haben nie einen formellen Kurs besucht oder eine Schulung zur Verwendung von Datenbanken erhalten. Tatsächlich haben die meisten von uns wahrscheinlich eher eine Excel-Schulung für unsere Projekte erhalten als irgendetwas anderes. Wenn wir über die Ausgabe von Daten sprechen, möchte ich diese Gelegenheit nutzen, um dich zu fragen, ob die Verwendung von Datenbanken nicht besser für dich wäre. Es gibt zwei Gründe, warum ich diese Herausforderung annehme.

Erstens macht es der Designer so einfach, mit Datenbanken zu interagieren - sowohl um Daten rein- als auch rauszuholen. Zweitens gibt es so viele Funktionen, die Datenbanken bieten. Du denkst vielleicht, dass die Arbeit mit Dateien einfacher und schneller ist, aber ich möchte, dass du diese Annahme in Frage stellst. Mit ein bisschen Arbeit kannst du mit Datenbanken effektiver und effizienter arbeiten.

Genauer gesagt, sehe ich drei wesentliche Vorteile der Verwendung von Datenbanken gegenüber Dateien:

Zentrale Lage
Jeder, der schon einmal Dateien zum Speichern von Daten verwendet hat, kann bestätigen, wie unordentlich die Speicherung von Dateien mit der Zeit wird. Ordner und Ordner mit Daten sind einfach verstreut und oft nur schwer zu finden, wenn man nicht immer extrem gut organisiert ist. Eine Datenbank, in der du deine Daten speicherst, ist sinnvoller, da sie sich an einem zentralen Ort befindet. Datenbanken macht es nichts aus, ob die Daten eine Zeile oder eine Milliarde Zeilen umfassen; sie können mit jeder Größe umgehen.
Größe und Flexibilität
Die Leistung einer Datenbank ist unschlagbar. Wer schon einmal versucht hat, 500.000 Datenzeilen in eine Excel-Tabelle einzugeben, weiß, dass die meisten Dateitypen nicht für eine gute Skalierung ausgelegt sind. Die Flexibilität, von einem Datensatz auf eine Milliarde Datensätze zu kommen, ist beeindruckend. Die Flexibilität einer Datenbank zeigt sich auch darin, dass sie alle verschiedenen Datentypen an einem Ort speichern kann. Eine Datenbank, die JSON-Formate, räumliche Formate und Standardtabellenformate speichern kann, bedeutet, dass die Nutzer/innen nicht mehrere Dateitypen für die Daten verwalten müssen.
Zugang und Kontrolle
Dateien mit wertvollen Daten, die über den ganzen Rechner verteilt sind, stellen ein Risiko für Unternehmen und Nutzer/innen dar. Wenn ein/e Nutzer/in seinen/ihren Laptop zufällig eingeloggt lässt und jemand die Gelegenheit nutzt, um in den Dateien zu stöbern, kann er/sie nicht verhindern, dass er/sie sich eine Datei auf dem Desktop schnappt und sie per E-Mail an sich selbst oder jemand anderen schickt. Sie ist da, offen und ungeschützt. Mit einer Datenbank hingegen kannst du deine Daten sichern - sie sind auf Servern gespeichert, die sich innerhalb der Mauern eines Unternehmens befinden und auf die du gut aufpassen kannst.

Solange ich mich erinnern kann, standen Datenbanken für "echte" Analysen in großem Maßstab. Ich versichere dir, dass Dateien für die Analyse genauso wichtig sind, und wir werden das als Nächstes besprechen.

Ausgabe in Dateien

Die wichtigste Methode, um Daten in eine Datei auszugeben, ist die Verwendung des Werkzeugs Daten ausgeben, das das Hauptthema dieses Kapitels ist. Dieses Werkzeug hat viele Funktionen, die über die einfache Ausgabe von Daten hinausgehen. Zunächst schauen wir uns an, wie wir die Daten in eine einzelne CSV-Datei ausgeben können. Danach werden wir uns die Ausgabe in Excel und das Alteryx-eigene Datenbankformat YXDB ansehen.

Hinweis

Alteryx hat einige Dateitypen, die proprietär sind und nur mit Alteryx Designer und Server verwendet werden. Einer davon ist ein Datenbankdateiformat namens YXDB. Dieses Dateiformat ist der effizienteste Dateityp für das Lesen und Schreiben im Designer, da es keine Größenbeschränkung hat, für maximale Geschwindigkeit komprimiert ist und zusätzliche Metadaten enthält, die auf die Quelle der Daten und die Art ihrer Erstellung verweisen. Es gibt keine Zeilenbegrenzung - kein anderes Dateiformat außer Text unterstützt so viele Zeilen.

Ausgabe in eine CSV-Datei

Um eine CSV-Datei mit dem Werkzeug Ausgabedaten auszugeben, ziehe zuerst ein Werkzeug für Ausgabedaten auf die Arbeitsfläche und stelle sicher, dass es mit dem Werkzeug verbunden ist, von dem du Daten ausgeben möchtest (siehe Abbildung 4-1).

Abbildung 4-1. Ausgabe in eine CSV-Datei

Um das Werkzeug Ausgabedaten zu konfigurieren, musst du dem Designer mitteilen, wo du die Ausgabedatei speichern möchtest. Dazu klickst du wie beim Werkzeug Eingabedaten auf den Pfeil nach unten auf der rechten Seite des Konfigurationsfensters, wodurch sich das Fenster Datenverbindungen öffnet (siehe Abbildung 4-2).

Abbildung 4-2. Fenster Datenverbindungen

Im Fenster Datenverbindungen wählst du die Option CSV. Wähle dann im nächsten Fenster einen Namen für die Datei (siehe Abbildung 4-3).

Abbildung 4-3. Speichern einer Datendatei im CSV-Format

Klicke auf Speichern. Damit hast du die Konfiguration für die Ausgabe der Daten in eine CSV-Datei auf deinem Rechner abgeschlossen! Erinnere dich daran, dass du die Konfiguration bei Bedarf auch ändern kannst (siehe Abbildung 4-4).

Abbildung 4-4. CSV-Konfigurationsoptionen

Schauen wir uns einige der Konfigurationsoptionen für CSV-Dateien an.

Konfigurationsoptionen

Generell ist es wichtig, die Konfigurationsoptionen zu verstehen, die dir für das Werkzeug Ausgabedaten zur Verfügung stehen, denn es gibt viele Optionen, die bestimmen können, ob du die Datei richtig lesen kannst. Es gibt auch kleine Tricks, die dir 2-3 Schritte im Arbeitsablauf abnehmen, wenn du die richtigen Optionen einstellst. Schauen wir uns diese Optionen einmal an:

Maximale Datensätze pro Datei
Mit dieser Option kannst du festlegen, wie viele Datensätze herausgeschrieben werden sollen. Wenn du dich im Entwicklungsmodus befindest und nur testest, kannst du hier z. B. 10 Datensätze einstellen, damit es schnell geht, bis du es vollständig ausführen musst.
Dateiformat
Dies ist die Option, mit der du deinen Dateityp auswählst.
Begrenzungszeichen
Das ist sehr wichtig, denn es ist das eigentliche Zeichen, das deine Daten in Spalten trennt. Wenn du versuchst, die Daten in eine Datei auszugeben, und alle Daten in einer Spalte landen, dann ist dein Trennzeichen wahrscheinlich falsch.
Die erste Zeile enthält die Feldnamen
Mit dieser Option kannst du festlegen, ob deine Daten Kopfzeilen enthalten oder nicht.
Felder der Angebotsausgabe
Diese Option ähnelt der Option des Werkzeugs Eingabedaten, die sicherstellt, dass die Werte nicht willkürlich durch Anführungszeichen abgeschnitten werden.
Code Seite
Dies ist die Option, mit der du die Codeseite festlegen kannst. In den meisten Fällen wirst du diese Option nie ändern müssen.
Stil des Zeilenabschlusses
Wenn du mit Dateien von verschiedenen Systemen (Unix, Mac oder Windows) arbeitest, musst du diese Option möglicherweise konfigurieren, um die Dateien richtig zu schreiben.
Stückliste schreiben
Mit dieser Option kannst du die Byte Order Mark (BOM) in der Ausgabe ein- oder ausschließen.

Wenn du deinen Workflow mit dem konfigurierten Ausgabedaten-Tool ausgeführt hast, ist es ganz einfach, die Datei in Alteryx zu öffnen. Lass uns darüber sprechen, wie du die Ausgabedatei anzeigen kannst.

Anzeigen der Ausgabedatei

Im Ergebnisfenster wirst du feststellen, dass alle aufgelisteten Eingaben oder Ausgaben auch als Hyperlink angezeigt werden, auf den du klicken kannst, um die Datei zu öffnen. Du kannst deine Protokolle auch schnell filtern, indem du auf die Überschriften deines Ergebnisfensters klickst, um z. B. nur die Warnungen oder Meldungen zu sehen (siehe Abbildung 4-5).

Abbildung 4-5. Ergebnisfenster

Ausgabe in eine Excel-Datei

Die Ausgabe in eine Excel-Datei ist sehr ähnlich wie die Ausgabe in eine CSV-Datei, es gibt nur ein paar andere Optionen. Du musst immer noch die Datei auswählen, in die du schreiben willst, aber anstatt auf den Pfeil nach unten zu klicken und eine Datei auszuwählen, kannst du einfach den Dateinamen und den Speicherort in das Textfeld eingeben (oder kopieren und einfügen). Wenn du den Dateinamen richtig eingibst und die Dateierweiterung .xlsx angibst, wird er automatisch erkannt und die Standardkonfiguration eingestellt. Wenn du auf den Pfeil nach unten klickst und die Datei über die Benutzeroberfläche auswählst, werden einige der Optionen (z. B. Maximale Datensätze pro Datei und Dateiformat) sowie die Auswahl des Blattnamens automatisch eingestellt. Wenn du den Dateipfad und den Dateinamen eingibst, musst du die Konfiguration manuell vornehmen und die "|||" (Pipe-Trennzeichen) am Ende des Dateinamens verwenden, um genau anzugeben, welches Blatt du verwenden möchtest (siehe Abbildung 4-6).

Abbildung 4-6. Dateipfad

Ein wichtiger Punkt, den du beachten solltest, ist, dass die Blätter einer Excel-Datei am besten mit den Tabellen einer Datenbank verglichen werden können. Sie funktionieren auf die gleiche Weise. Lasst uns mehr darüber reden, wie wir die Ausgabe konfigurieren können.

Konfigurationsoptionen

Die wichtigste Option für die Ausgabe von in Excel ist die dritte Option in Abbildung 4-6 (Ausgabeoptionen), mit der du die Kriterien für die Ausgabe der Datei auswählen kannst. Du musst sicherstellen, dass du dies richtig eingestellt hast, da es sonst zu Fehlern kommen kann, wenn du den Workflow ein zweites Mal ausführst. Bei der Ausgabe in Excel hast du vier Konfigurationsoptionen zur Auswahl:

An bestehendes Blatt anhängen
Verwende diese Option, wenn du bereits eine Datei/ein Blatt erstellt hast, das du hinzufügen möchtest.
Blatt oder Bereich überschreiben
Verwende diese Option, wenn du ein Blatt oder einen Bereich ersetzen willst.
Datei überschreiben (entfernen)
Verwende diese Option, wenn du eine ganze Arbeitsmappe ersetzen willst.
Neues Blatt erstellen
Verwende diese Option, wenn du bei jedem Start ein neues Blatt erstellen möchtest. Achtung: Wenn dieses Blatt bereits erstellt wurde, gibt der Designer eine Fehlermeldung aus, die besagt, dass es nicht beschrieben werden kann, weil es bereits existiert.

Ausgabe in eine YXDB-Datei

Die Ausgabe in YXDB ist wahrscheinlich die einfachste Art der Ausgabe. Für viele Anwendungsfälle, z. B. wenn eine Datei benötigt wird und der Datensatz ziemlich groß ist oder wenn die Eigentümer eines Datensatzes nicht wollen, dass die Daten geändert werden, ist dies eine wirklich gute Option, wenn du die Daten schnell in ein einfaches Format bringen willst und keine Anforderungen an die Berichterstattung oder Präsentation der Daten hast.

Um deine Daten in das YXDB-Format auszugeben, befolge einfach die Schritte, die du für CSV und Excel gemacht hast, und wähle den Ort, an dem du die Daten speichern möchtest. Erinnere dich daran, dass der Designer dir so weit wie möglich hilft, indem er automatisch Konfigurationen festlegt, wenn du den Dateityp auswählst (siehe Abbildung 4-7).

Abbildung 4-7. Konfigurationen für den Dateityp YXDB

Nimm dir etwas Zeit, um dich mit den YXDB-Dateitypen vertraut zu machen. Das wird dir auf deiner Reise mit Alteryx definitiv helfen. So wichtig die Ausgabe in Dateien wie YXDB auch ist, ich würde sagen, dass die Ausgabe in Datenbanken sogar noch wichtiger ist. Wir wollen sicherstellen, dass du ein solides Verständnis dafür bekommst, wie du mit Alteryx Designer in Datenbanken ausgeben kannst.

Ausgabe in Datenbanken

Wie bereits im letzten Kapitel erwähnt, unterstützt Alteryx Designer fast alle der weltweit am häufigsten verwendeten Datenquellen - Microsoft SQL Server, Amazon S3, MongoDB, MySQL und sogar neuere Quellen wie Snowflake und Databricks. Es macht Spaß, sich all die Kombinationen von Datenquellen vorzustellen, aus denen man lesen und in die man schreiben kann! Das ist einer der Gründe, warum Alteryx so flexibel ist. Wenn du Daten von Excel zu Amazon S3 verschieben musst, kannst du das tun. Wenn du Daten von Microsoft SQL Server nach Snowflake verschieben willst, kannst du das tun. Dazu musst du wissen, wie du das Tool "Output Data" für deine jeweilige Datenquelle verwenden kannst. Ich werde in diesem Buch nicht auf jede Datenquelle eingehen, aber ich werde ein paar Beispiele nennen, die hilfreich sein dürften, da sie auf ähnliche Weise funktionieren.

Im letzten Kapitel hast du gelernt, wie du dich mit Datenbanken verbinden kannst und wie du das Werkzeug Eingabedaten verwendest. In diesem Kapitel wirst du dich mit dem Werkzeug Ausgabedaten auf die gleiche Weise mit ODBC oder OLEDB verbinden, wie du es mit dem Werkzeug Eingabedaten getan hast. Wenn du noch einmal wissen möchtest, wie du eine Verbindung oder eine Zugangsberechtigung einrichtest und eine Verbindung herstellst, empfehle ich dir, den Teil im letzten Kapitel noch einmal durchzuarbeiten. Beim Werkzeug Ausgabedaten gibt es jedoch ein paar Besonderheiten, auf die ich in den folgenden Beispielen eingehe.

Ausgabe an Microsoft SQL Server

Als Erstes holst du dir ein Werkzeug für Ausgabedaten aus der Palette der Ein-/Ausgabe-Werkzeuge und konfigurierst es. Um das Werkzeug zu konfigurieren, wähle "Verbindung einrichten" (siehe Abbildung 4-8).

Abbildung 4-8. Konfigurieren des Werkzeugs Ausgabedaten

Wenn das Fenster Datenverbindungen geöffnet ist, wähle die Datenbank aus, mit der du dich verbinden möchtest. In diesem Beispiel wählst du ODBC für Microsoft SQL Server (siehe Abbildung 4-9).

Abbildung 4-9. Microsoft SQL Server ODBC

Wenn du die gewünschte Verbindung auswählst, wird ein Fenster angezeigt, das je nach Art der Verbindung unterschiedlich aussieht. Da du eine Verbindung zu ODBC herstellst, siehst du den Verbindungsmanager (siehe Abbildung 4-10).

Abbildung 4-10. Verbindungsmanager

Wie ich schon gesagt habe, ist es wichtig, dass du ein bisschen herumspielst, wenn du zum ersten Mal mit einem Designer arbeitest. Gib dir Zeit, verschiedene Optionen zu erforschen und auszuprobieren, damit: 1) du dich mit den verschiedenen Optionen vertraut machst, aber vor allem 2) du lernst, welche Optionen dir das geben, was du willst (Benutzerfreundlichkeit, Leistung oder sogar eine funktionierende Verbindung).

Im Fenster SQL Server ODBC-Verbindung wählst du deinen DSN aus und gibst die entsprechenden Anmeldedaten ein. Es gibt einen Konfigurationsschritt, der nur im Tool Ausgabedaten vorkommt, und zwar die Auswahl der Ausgabetabelle. Du musst dem Designer mitteilen, welche Tabelle du ausgeben möchtest. Sobald du einen Tabellennamen eingegeben hast, klicke auf OK (siehe Abbildung 4-11).

Abbildung 4-11. Ausgabetabelle

Du siehst nun das Konfigurationsfenster mit den Grundeinstellungen. Gehen wir die Optionen durch, damit du weißt, was du ändern oder aktualisieren kannst.

Konfigurationsoptionen

Während wir Maximale Datensätze pro Datei und Dateiformat früher in diesem Kapitel besprochen haben, wurden Verbindungs-ID und Tabelle als Teil der Verbindung festgelegt, und für das Werkzeug Ausgabedaten gibt es einige wichtige Optionen, die sich unterscheiden. Diese Optionen unterscheiden sich geringfügig, je nachdem, ob du eine Verbindung über ODBC oder OLEDB herstellst:

Output Optionen

Du hast viele Möglichkeiten, wie du die Daten schreiben willst. Du kannst alles machen, vom Anhängen über das Löschen von Daten und Anhängen bis hin zum vollständigen Löschen der Tabelle oder dem Löschen von Daten vor dem Schreiben. Du hast auch die Möglichkeit, Updates durchzuführen. Mit all diesen Optionen kannst du deine Arbeitsabläufe sehr präzise gestalten und so viel oder so wenig aktualisieren, wie du brauchst (siehe Abbildung 4-12).

Warnung

Um die Aktualisierungsanweisungen in den Ausgabeoptionen verwenden zu können, musst du sicherstellen, dass du Primärschlüssel in deiner Tabelle hast.

Abbildung 4-12. Ausgabeoption zum Erstellen einer neuen Tabelle
Feldkarte anhängen
Mit dieser Option kannst du verschiedene Felder deiner Ausgabe den Tabellen-/Blattfeldern zuordnen, die in der Ausgabequelle vorhanden sind.
Schlüssel für Update
Wenn du eine Datenbankaktualisierung durchführst, kannst du dies nutzen, um der Datenbank einen Schlüssel zu geben.
SQL-Anweisung vorab erstellen

Mit dieser Option kannst du eine SQL-Anweisung vor deiner Hauptaktualisierung/-ausgabe ausführen. Dies ist sehr nützlich, wenn du eine temporäre Tabelle erstellen, bestimmte Daten löschen, eine Tabelle aktualisieren oder sogar eine gespeicherte Prozedur ausführen musst, bevor du die Daten in die Tabelle schreibst, die in der Konfiguration des Ausgabedatentools angegeben ist.

Hinweis

Wahrscheinlich musst du das OLEDB-Format verwenden, um Stored Procedures zu nutzen.

Post Create SQL Statement
Dies ist die gleiche Option wie die Option Pre Create SQL Statement, mit der du eine SQL-Anweisung ausführen kannst, aber in diesem Fall erst, nachdem du die Daten in die Tabelle geschrieben hast, die in der Konfiguration des Output Data Tools angegeben wurde.
Pre/Post SQL DROP TABLE-Fehler ignorieren
Wenn Fehler von der Datenbank zurückgegeben werden, werden sie ignoriert. So wird verhindert, dass der Arbeitsablauf fehlschlägt.
Tabelle/Feldname SQL-Stil
Je nach Art der Datenbank, mit der du dich verbindest, musst du dies eventuell ändern, wenn der SQL-Stil deiner Tabellen- und/oder Feldnamen Anführungszeichen enthalten muss oder nicht.
Transaktionsgröße
Das ist die Anzahl der Zeilen, die gleichzeitig in die Datenbank geschrieben werden. Wenn du mit großen Datenbankabfragen arbeitest, solltest du eine optimale Größe für deine Datenbank festlegen, die von Faktoren wie dem verfügbaren Speicher abhängt.
Transaktionsnachrichten anzeigen
Mit dieser Option kannst du für jede Transaktion eine Meldung im Ergebnisprotokoll des Workflows anzeigen. Jede Meldung enthält die Summe der Datensätze, die bis zu dieser Transaktion geschrieben wurden.
Räumliches Objektfeld
Mit dieser Option kannst du das Geo-Objekt festlegen, das in die Ausgabe aufgenommen werden soll. Räumliche Dateien können nur ein räumliches Objekt pro Datensatz enthalten.
Spatial Object Field Size
Mit dieser Option kannst du die Größe des räumlichen Objekts festlegen.
Projektion
Die Methode, mit der ein Teil der kugelförmigen Erde auf einer ebenen Fläche abgebildet wird, nennt man Kartenprojektion. Wenn du mit räumlichen Daten arbeitest, kannst du mit dieser Option den Projektionstyp für die Ausgabe auswählen. In der Standardeinstellung ist Projektion leer und wird nach WGS 84 ausgegeben. Ausführliche Informationen zur Projektionsunterstützung findest du in der Alteryx-Hilfedokumentation.

Sobald du die Konfigurationsoptionen nach deinen Wünschen eingestellt hast, führst du den Workflow einfach aus. Wenn du alles richtig gemacht hast, wirst du Daten in deiner Datenbank sehen. Gehe behutsam vor und wende dich an jemanden, wenn du Hilfe brauchst. Wenn du es geschafft hast, wirst du in der Lage sein, tolle Workflows zu erstellen!

Ausgabe an mehrere Quellen

Eine hilfreiche Funktion des Designers ist die Möglichkeit, in viele verschiedene Quellen gleichzeitig zu schreiben. Du kannst sowohl in Dateien als auch in Datenbanktabellen schreiben und die Daten basierend auf den Werten eines Feldes aufteilen. Nehmen wir zum Beispiel an, du hast eine Tabelle mit Informationen zum Verkaufsgebiet (siehe Abbildung 4-13).

Abbildung 4-13. Informationen zum Verkaufsgebiet

Wenn du jede Gebietsgruppe in ein eigenes Blatt oder eine eigene Tabelle aufteilen musst, kannst du die Daten in vier verschiedenen Tabellen ausgeben - eine für jede Gruppe (Nordamerika, Europa, Pazifik und NA). Die Anzahl der erstellten Tabellen, Dateien oder Blätter hängt von der Anzahl der unterschiedlichen Werte in der gewählten Spalte ab.

Um diese Option zu konfigurieren, aktiviere das Kontrollkästchen "Datei-/Tabellenname aus Feld übernehmen" am unteren Rand des Konfigurationsfensters des Ausgabedatentools (siehe Abbildung 4-14).

Abbildung 4-14. Datei/Tabellenname aus Feld übernehmen

Du entscheidest dann, welche Option du für die Ausgabe verwenden möchtest (siehe Abbildung 4-15).

Abbildung 4-15. Ausgabe-Option

Gehen wir einige Beispiele für jede dieser Ausgabeoptionen durch.

Suffix an den Datei-/Tabellennamen anhängen

Mit dieser Option kannst du für jeden Wert des ausgewählten Feldes eine Ausgabe in die Tabellen oder Dateien vornehmen. Nehmen wir an, du hast "Test" als Datenquellenname gewählt. In unserem Beispiel SalesTerritoryGroup würdest du die in Abbildung 4-16 dargestellten Tabellen sehen. Beachte, dass für jede Region die Region (auch bekannt als SalesTerritoryGroup) an die Tabelle Test angehängt wird.

Abbildung 4-16. Tabellen-Suffix

Präfix dem Datei-/Tabellennamen voranstellen

Diese Option verhält sich genauso wie die Option Suffix, mit dem Unterschied, dass die Namen der Felder an den Anfang der Datei-/Tabellennamen angehängt werden. Wenn wir zum Beispiel in Excel-Tabellen schreiben würden, sähen wir etwas wie in Abbildung 4-17, in der die Region an den Anfang jedes Tabellennamens (Blattname) angehängt wird.

Abbildung 4-17. Tabelle Präfix

Datei/Tabellenname ändern

Bei den beiden vorherigen Optionen wird die Ausgabe den Namen entweder durch Anhängen oder Voranstellen hinzugefügt. Mit dieser Option wird der gesamte Datei-/Tabellenname geändert. Anstatt den Namen "Test" zu sehen, können wir mit der Option Datei-/Tabellenname ändern die Ausgabe etwas sauberer gestalten (siehe Abbildung 4-18).

Abbildung 4-18. Datei/Tabellenname ändern

Gesamten Dateipfad ändern

Es gibt zahlreiche kreative Möglichkeiten, diese Option zu nutzen. Eine davon ist sehr nützlich, wenn du mit CSV- oder TXT-Dateien arbeitest und in mehrere Dateien schreiben willst, die sich in verschiedenen Verzeichnissen befinden. Wenn du diese Option wählst, um in das CSV-Format zu schreiben, kannst du auch sehr spezifisch vorgehen und die Dateipfade dynamisch erstellen. Nehmen wir an, dass wir für jede Gebietsgruppe einen entsprechenden Ordner haben und dass wir in jedem Ordner die entsprechenden Dateien nach Gebietsregionen ausgeben wollen. Die Formel könnte etwa wie in Abbildung 4-19 aussehen. (Mehr zum Erstellen von Formeln in Kapitel 5)

Abbildung 4-19. Formel zum Ändern des gesamten Dateipfads

Wenn wir uns anschauen, wie eine der Gebietsgruppen aussehen würde, sähen wir so etwas wie Abbildung 4-20. Jede Vertriebsgebietsregion wurde zu einer eigenen CSV-Datei innerhalb ihrer Vertriebsgebietsgruppe Nordamerika.

Abbildung 4-20. Ausgaben der Vertriebsgebietsdatei

Du hast die Freiheit, dynamisch zu bestimmen, wo die Dateien abgelegt und wie sie benannt werden. Du könntest zum Beispiel alle Dateien der Vertriebsgebietsgruppe Europa in einen "europäischen" Ordner auf einem anderen Server oder einem gemeinsamen Laufwerk verschieben, wenn du das möchtest. Wichtig dabei ist, dass der Designer flexibel genug ist, um diese Logik in deinen Arbeitsablauf einzubauen, damit du sie nicht manuell ausführen musst.

Fazit

Die Ausgabe deiner Daten aus Alteryx ist eine leistungsstarke Funktion, mit der du Daten in das gewünschte Format bringen kannst, und zwar dynamisch und mit Präzision. Es ist wichtig zu wissen, dass es viele weitere Tools gibt, mit denen du Daten in einem bestimmten Format ausgeben kannst. Zu diesen Tools gehören:

  • Daten in die DB schreiben

  • Renderwerkzeug

  • Amazon S3 Upload

  • Google Sheets Ausgabe

  • MongoDB Ausgabe

  • In PowerBI veröffentlichen

  • Auf Tableau Server veröffentlichen

  • Salesforce Output Meta

  • SharePoint Listenausgabe

  • API-Ausgabe

  • Blob Ausgabe

  • Python-Werkzeug

  • R Werkzeug

  • Befehl ausführen

Du kannst jetzt die gewünschten Daten aktualisieren und Daten in Stapeln über mehrere Dateien oder Tabellen ausgeben. In diesem Kapitel hast du gelernt, wie du sowohl in Dateien als auch in Datenbanken schreiben kannst. Auch hier fordere ich dich auf, deine Annahmen, dass du immer in Dateien schreibst, zu überdenken. Vielleicht ist eine Datenbank für dich vorteilhafter. Du hast einige spezielle Optionen, wie z. B. Pre- und Post-SQL-Anweisungen, die dir helfen können, deine Ausgaben in Datenbanken zu verwalten. Es ist wichtig, diese Optionen zu verstehen, aber ich empfehle, dass du dir Zeit nimmst, die Optionen zu lernen, die ich in diesem Kapitel behandelt habe, damit du das Beste aus den Ausgabewerkzeugen herausholen kannst.

Bisher haben wir uns damit beschäftigt, wie du deine Daten in Alteryx Designer ein- und auslesen kannst. Jetzt möchte ich dir zeigen, wie du Alteryx Designer nutzt, um deine Daten zu bereinigen. Dies ist ein wichtiger und entscheidender Schritt auf dem Weg zu mehr Kompetenz und zum Verständnis komplexerer Themen in Alteryx Designer!

Get Alteryx Designer: Das endgültige Handbuch now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.