Vorwort

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In den letzten 20 Jahren habe ich viele meiner Arbeitsstunden damit verbracht, Daten mit SQL zu bearbeiten. Die meiste Zeit dieser Jahre habe ich in Technologieunternehmen gearbeitet, die eine breite Palette von Verbraucher- und Business-to-Business-Branchen abdecken. In dieser Zeit sind die Datenmengen dramatisch gestiegen, und die Technologie, die ich benutze, hat sich sprunghaft verbessert. Datenbanken sind schneller als je zuvor, und die Berichts- und Visualisierungstools, mit denen die Bedeutung der Daten vermittelt werden kann, sind leistungsfähiger als je zuvor. Eine Sache, die jedoch bemerkenswert konstant geblieben ist, ist, dass SQL ein wichtiger Teil meines Werkzeugkastens ist.

Ich erinnere mich noch gut daran, wie ich SQL gelernt habe. Ich hatte meine Karriere im Finanzwesen begonnen, wo Tabellenkalkulationen die Regel sind, und ich war ziemlich gut darin geworden, Formeln zu schreiben und mir all diese Tastenkombinationen zu merken. Eines Tages rastete ich aus und drückte Strg und Alt auf meiner Tastatur, nur um zu sehen, was passiert (und erstellte dann einen Spickzettel für meine Kollegen). Das war zum Teil lustig und zum Teil überlebenswichtig: Je schneller ich meine Tabellenkalkulationen beherrschte, desto wahrscheinlicher war es, dass ich vor Mitternacht mit meiner Arbeit fertig wurde, damit ich nach Hause gehen und schlafen gehen konnte. Die Beherrschung der Tabellenkalkulation verschaffte mir den Einstieg bei meiner nächsten Stelle, einem Startup, wo ich zum ersten Mal mit Datenbanken und SQL in Berührung kam.

Zu meinen Aufgaben gehörte es, Inventardaten in Tabellenkalkulationen zu verarbeiten, und dank der frühen Internetgröße umfassten die Datensätze manchmal Zehntausende von Zeilen. Damals waren das "Big Data", zumindest für mich. Ich hatte mir angewöhnt, eine Tasse Kaffee zu trinken oder zu Mittag zu essen, während die CPU meines Computers mit der Ausführung seiner Vlookup-Magie beschäftigt war. Eines Tages fuhr mein Vorgesetzter in den Urlaub und bat mich, mich um das Data Warehouse zu kümmern, das er mit Access auf seinem Laptop erstellt hatte. Um die Daten zu aktualisieren, musste ich eine Reihe von Schritten durchführen: SQL-Abfragen in einem Portal, das Laden der daraus resultierenden CSV-Dateien in die Datenbank und das Aktualisieren der Tabellenkalkulationsberichte. Nach dem ersten erfolgreichen Laden begann ich zu tüfteln, um zu verstehen, wie es funktioniert, und drängte die Ingenieure, mir zu zeigen, wie ich die SQL-Abfragen ändern kann.

Ich war süchtig, und selbst als ich dachte, ich könnte meine Karriere in eine andere Richtung lenken, bin ich immer wieder zu Daten zurückgekehrt. Das Manipulieren von Daten, das Beantworten von Fragen, das Helfen meiner Kollegen, besser und intelligenter zu arbeiten, und das Lernen über Unternehmen und die Welt durch Datensätze haben mir immer wieder Spaß gemacht und mich begeistert.

Als ich anfing, mit SQL zu arbeiten, gab es nicht viele Lernressourcen. Ich besorgte mir ein Buch über die grundlegende Syntax, las es in einer Nacht durch und lernte von da an hauptsächlich durch Versuch und Irrtum. Damals, als ich noch lernte, fragte ich direkt Produktionsdatenbanken ab und brachte die Website mehr als einmal mit meinem übermäßig ehrgeizigen (oder wahrscheinlich einfach nur schlecht geschriebenen) SQL zum Absturz. Zum Glück verbesserten sich meine Fähigkeiten, und im Laufe der Jahre lernte ich, von den Daten in den Tabellen auszugehen und von der benötigten Ausgabe rückwärts zu arbeiten, indem ich technische und logische Herausforderungen und Rätsel löste, um Abfragen zu schreiben, die die richtigen Daten zurückgaben. Schließlich entwarf und baute ich Data Warehouses, um Daten aus verschiedenen Quellen zu sammeln und zu vermeiden, dass kritische Produktionsdatenbanken zusammenbrechen. Ich habe viel darüber gelernt, wann und wie man Daten aggregiert, bevor man eine SQL-Abfrage schreibt, und wann man Daten in einer eher rohen Form belässt.

Ich habe meine Notizen mit anderen verglichen, die etwa zur gleichen Zeit mit Daten angefangen haben, und es ist klar, dass wir meistens auf dieselbe Art und Weise gelernt haben. Die Glücklichen unter uns hatten Gleichgesinnte, mit denen sie Techniken austauschen konnten. Die meisten SQL-Texte sind entweder einführend und grundlegend (dafür gibt es definitiv einen Platz!) oder richten sich an Datenbankentwickler. Es gibt nur wenige Ressourcen für fortgeschrittene SQL-Benutzer, die sich auf Analyseaufgaben konzentrieren. Das Wissen bleibt meist in Einzelpersonen oder kleinen Teams hängen. Ein Ziel dieses Buches ist es, das zu ändern, indem es Praktikern ein Nachschlagewerk für die Lösung gängiger Analyseprobleme mit SQL an die Hand gibt und, so hoffe ich, zu neuen Untersuchungen von Daten mit Techniken inspiriert, die du vielleicht noch nicht kanntest.

In diesem Buch verwendete Konventionen

In diesem Buch werden die folgenden typografischen Konventionen verwendet:

Kursiv

Zeigt neue Begriffe, URLs, E-Mail-Adressen, Dateinamen, Dateierweiterungen und Schlüsselwörter an.

Constant width

Wird für Programmlistings sowie innerhalb von Absätzen verwendet, um auf Programmelemente wie Variablen- oder Funktionsnamen, Datenbanken, Umgebungsvariablen und Anweisungen zu verweisen.

Constant width bold

Zeigt Befehle oder anderen Text an, der vom Benutzer wortwörtlich eingetippt werden sollte.

Constant width italic

Zeigt Text an, der durch vom Benutzer eingegebene Werte oder durch kontextabhängige Werte ersetzt werden soll.

Tipp

Dieses Element steht für einen Tipp oder eine Anregung.

Hinweis

Dieses Element steht für einen allgemeinen Hinweis.

Warnung

Dieses Element weist auf eine Warnung oder einen Warnhinweis hin.

Code-Beispiele verwenden

Zusätzliches Material (Code-Beispiele, Übungen usw.) steht unter https://github.com/cathytanimura/sql_book zum Download bereit .

Wenn du eine technische Frage oder ein Problem mit den Codebeispielen hast, sende bitte eine E-Mail an

Dieses Buch soll dir helfen, deine Arbeit zu erledigen. Wenn in diesem Buch Beispielcode angeboten wird, darfst du ihn in deinen Programmen und deiner Dokumentation verwenden. Du musst uns nicht um Erlaubnis fragen, es sei denn, du reproduzierst einen großen Teil des Codes. Wenn du zum Beispiel ein Programm schreibst, das mehrere Teile des Codes aus diesem Buch verwendet, brauchst du keine Erlaubnis. Der Verkauf oder die Verbreitung von Beispielen aus O'Reilly-Büchern erfordert jedoch eine Genehmigung. Die Beantwortung einer Frage mit einem Zitat aus diesem Buch und einem Beispielcode erfordert keine Genehmigung. Wenn du einen großen Teil des Beispielcodes aus diesem Buch in die Dokumentation deines Produkts aufnimmst, ist eine Genehmigung erforderlich.

Wir freuen uns über eine Namensnennung, verlangen sie aber in der Regel nicht. Eine Quellenangabe umfasst normalerweise den Titel, den Autor, den Verlag und die ISBN. Ein Beispiel: "SQL for Data Analysis von Cathy Tanimura (O'Reilly). Copyright 2021 Cathy Tanimura, 978-1-492-08878-3."

Wenn du der Meinung bist, dass die Verwendung von Code-Beispielen nicht unter die Fair-Use-Regelung oder die oben genannte Erlaubnis fällt, kannst du uns gerne unter kontaktieren

O'Reilly Online Learning

Hinweis

Seit mehr als 40 Jahren bietet O'Reilly Media Schulungen, Wissen und Einblicke in Technologie und Wirtschaft, um Unternehmen zum Erfolg zu verhelfen.

Unser einzigartiges Netzwerk von Experten und Innovatoren teilt sein Wissen und seine Erfahrung durch Bücher, Artikel und unsere Online-Lernplattform. Die Online-Lernplattform von O'Reilly bietet dir On-Demand-Zugang zu Live-Trainingskursen, ausführlichen Lernpfaden, interaktiven Programmierumgebungen und einer umfangreichen Text- und Videosammlung von O'Reilly und über 200 anderen Verlagen. Weitere Informationen erhältst du unter http://oreilly.com.

Wie du uns kontaktierst

Bitte richte Kommentare und Fragen zu diesem Buch an den Verlag:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Nord
  • Sebastopol, CA 95472
  • 800-998-9938 (in den Vereinigten Staaten oder Kanada)
  • 707-829-0515 (international oder lokal)
  • 707-829-0104 (Fax)

Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter https://oreil.ly/sql-data-analysis aufrufen .

Schreib eine E-Mail an , um Kommentare oder technische Fragen zu diesem Buch zu stellen.

Neuigkeiten und Informationen über unsere Bücher und Kurse findest du unter http://oreilly.com.

Finde uns auf Facebook: http://facebook.com/oreilly

Folge uns auf Twitter: http://twitter.com/oreillymedia

Schau uns auf YouTube: http://www.youtube.com/oreillymedia

Danksagungen

Dieses Buch wäre ohne die Bemühungen einer Reihe von Leuten bei O'Reilly nicht möglich gewesen. Andy Kwan hat mich für dieses Projekt rekrutiert. Amelia Blevins und Shira Evans haben mich durch den Prozess geführt und mir hilfreiches Feedback gegeben. Kristen Brown begleitete das Buch durch den Produktionsprozess. Arthur Johnson hat die Qualität und Klarheit des Textes verbessert und mich ungewollt dazu gebracht, intensiver über SQL-Schlüsselwörter nachzudenken.

Viele Kolleginnen und Kollegen haben im Laufe der Jahre eine wichtige Rolle auf meiner SQL-Reise gespielt, und ich bin dankbar für ihre Tutorials, Tipps und den gemeinsamen Code sowie für die Zeit, die ich mit Brainstorming zur Lösung von Analyseproblemen verbracht habe. Sharon Lin hat mir die Augen für reguläre Ausdrücke geöffnet. Elyse Gordon gab mir viele Ratschläge zum Schreiben von Büchern. Dave Hoch und unsere Gespräche über Experimentanalyse inspirierten mich zu Kapitel 7. Dan, Jim und Stu von der Star Chamber sind seit langem meine Lieblingskollegen, mit denen ich mich gerne austausche. Ich bin auch allen Kolleginnen und Kollegen dankbar, die mir im Laufe der Jahre schwierige Fragen gestellt haben - und nachdem diese beantwortet waren, noch schwierigere Fragen stellten.

Ich möchte mich bei meinem Mann Rick, meinem Sohn Shea, meinen Töchtern Lily und Fiona und meiner Mutter Janet für ihre Liebe, ihre Ermutigung und vor allem für die Zeit bedanken, die sie mir für die Arbeit an diesem Buch geschenkt haben. Amy, Halle, Jessi und Den of Slack haben mich während der Monate des Schreibens und der Pandemieabriegelung bei Verstand und Lachen gehalten.

Get SQL für die Datenanalyse now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.