Vorwort

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

"Das kann doch nicht alles sein, was ein Datenkatalog kann. Was kann er wirklich?"

Vor etwa fünf Jahren saß ich allein im Büro zwischen 20 leeren Schreibtischen. Meine Firma hatte die Klimaanlage abgeschaltet, um die Umwelt zu schonen, und so war mir nicht nur unangenehm warm, sondern ich war auch verwirrt von den vielen Whitepapers, die vor mir lagen, sowohl in gedruckter Form als auch auf meinem Laptop. In den Papieren wurde eine neue Technologie namens Datenkatalog beschrieben. Als Unternehmensarchitekt war ich gebeten worden, einen Datenkatalog für unser Unternehmen einzuführen. Aber zuerst musste ich ihn verstehen.

In den Beiträgen, die ich mir ansah, wurden coole, fortschrittliche Funktionen beschrieben: spaltenbasierte Datenreihen, Graphvisualisierungen von Ontologien und Workflows für den Zugriff auf virtualisierte Daten. Nützlich. Faszinierend, wirklich. Aber was war der Sinn eines Datenkatalogs überhaupt? Ich schwitzte, sowohl körperlich als auch geistig, als ich versuchte, meine Erfahrungen zu nutzen, um das Potenzial dieser neuen Technologie herauszufinden.

Ich habe einen BA, MA und PhD in Bibliotheks- und Informationswissenschaft (LIS). Ich habe LIS in Universitätskursen unterrichtet und war auf Konferenzen in der ganzen Welt. Ich habe in diesem Bereich schon viel erlebt, sowohl Gutes als auch Schlechtes. Während meines ersten Jobs in der Pharmaindustrie rief mich die Geschäftsleitung regelmäßig spät nachts an, weil die Inspektionen der Behörden aus dem Ruder gelaufen waren. Die Inspektoren stellten ihnen eine Vielzahl von Fragen: Welche Temperatur hatte dieses Rohr in dieser Maschine im Juni 1992? Wo ist der Nachweis, dass der Gärtank gemäß der Standardarbeitsanweisung (SOP) gereinigt wurde? Als die Datenmanager suchten und keine Antwort fanden, riefen sie mein Team an - das Team für Aufzeichnungen und Informationsmanagement.

Wir setzten unsere Such-Superkräfte ein, um die benötigten Informationen zu finden. Wir waren geschickt bei unseren Abfragen, nutzten Intuition und Kreativität, um unsere Schritte zu planen, und griffen auf unser Wissen zurück, um unsere Suche zu steuern. Wir waren dazu in der Lage, weil wir einen Leitsatz hatten: Wie man Daten organisiert, bestimmt, wie man sie durchsuchen kann. Weil wir wussten, wie die Daten organisiert waren, wussten wir, wie wir mit der Suche beginnen, sie verändern, erweitern, den Fokus ändern, Treffer ausschließen und die Informationen finden konnten, die wir brauchten. Manchmal war das einfach, manchmal schwierig, aber wir kamen jedes Mal ans Ziel.

Dieser Leitsatz hat mich durch meine gesamte Karriere begleitet. Ich habe Möbel, Waffen, menschliches Gewebe, eine Menge Papier und riesige Datenmengen katalogisiert. Ich weiß, wie man einen physischen Zettelkatalog in einer Bibliothek aufbaut und betreibt. Ich kenne mich mit Datensätzen und Informationsmanagementsystemen aus, die sowohl physisch als auch digital gespeichert werden. Wir haben Daten sowohl vor Ort als auch später in der Cloud gespeichert und katalogisiert. Bei allem, was ich erlebt habe, habe ich festgestellt, dass eine schlecht organisierte Datenlandschaft die Suche nach den benötigten Informationen zu einem schrecklichen Erlebnis macht. Du wirst raten müssen, wo du suchen und was du abfragen sollst. Wenn deine Daten jedoch logisch und systematisch organisiert sind, weißt du genau, wo du suchen und was du abfragen musst. Das wird eine viel bessere Erfahrung sein.

Der Gedanke, dass die Art und Weise, wie du Daten organisierst, bestimmt, wie du danach suchst, spiegelt sich auch in unseren Internetgewohnheiten wider. Wir denken gar nicht mehr darüber nach, wie wir suchen; es ist so intuitiv. Bei der Arbeit, in der IT-Landschaft unseres Unternehmens, kann das ganz anders aussehen. Wir suchen vergeblich - Unternehmen kennen kaum ihre eigenen Daten, geschweige denn, wie sie verarbeitet werden. Die Daten sind unauffindbar und unüberschaubar. Wenn wir doch nur eine Suchmaschine für Unternehmen hätten...

An diesem heißen Sommertag, allein in dem leeren Büro, umgeben von physischen Papieren und Dutzenden von offenen PDFs auf meinem Laptop, wurde es mir plötzlich klar.

"Dieser Datenkatalog hat das Potenzial, eine Suchmaschine für Unternehmen zu werden! Wir bekommen endlich eine Maschine, die für Unternehmen das tun kann, was Suchmaschinen für das Internet getan haben. Der Datenkatalog ist eine Suchmaschine!"

Diese Erkenntnis führte ein paar Jahre später zu einer weiteren. Alle Papiere, die ich an jenem schicksalhaften Tag las, sowie die gesamte Dokumentation, die darauf folgte, konzentrierten sich darauf, die komplexen Funktionen von Datenkatalogen zu erklären. Sie erklärten nicht den Datenkatalog selbst und wie er die Art und Weise, wie wir Daten organisieren und suchen, revolutionieren könnte. Nirgendwo hat jemand über die Zukunft des Datenkatalogs als Suchmaschine für Unternehmen gesprochen. Diese Erkenntnis hat uns zu dem Buch geführt, das du heute liest.

Wer sollte dieses Buch lesen?

Obwohl ich die Erleuchtung über das Potenzial eines Datenkatalogs hatte und es mir kristallklar war, stand ich vor der Aufgabe, den wichtigen Interessengruppen meines Unternehmens die Funktionen zu erklären. Obwohl ich wusste, dass sie die Vorteile dieses Tools erkennen würden, wenn sie sich nur die Zeit nähmen, es zu verstehen, waren sie einfach nicht interessiert und hatten auch keine Zeit, es zu studieren. Ich musste mir etwas einfallen lassen, wie ich sie erreichen konnte.

Ich kam auf die Idee zurück, den Datenkatalog als Suchmaschine für Unternehmen zu nutzen. Ich fragte mich also: "Wonach suchen die Leute? Wonach würde ein Datenwissenschaftler suchen? Ein Datenschutzbeauftragter? Einem Beauftragten für Informationssicherheit?"

Ich beschloss, die wichtigsten Funktionen des Datenkatalogs in kleinen Geschichten über bestimmte Interessengruppen zu demonstrieren. Jedes Slide Deck hatte ein zentrales Bild: eine minimalistische Suchleiste mit dem Logo des Unternehmens darüber. Ich erklärte den Informationsbedarf eines bestimmten Stakeholders, zeigte die Suche in der Suchleiste, präsentierte das Ergebnis und erklärte abschließend, wie die Ergebnisse genutzt werden können. Auf diese Weise zeigte ich einfache und komplexe Suchvorgänge, wie man in der Datenkette vor- und zurückblättern kann, wie man in Domänen auf- und absteigt und wie man in dem Diagramm, das unser Unternehmen darstellte, Beziehungen herstellt. Der Inhalt war derselbe wie bei meinen vorherigen Demonstrationen, aber dieses Mal wurde er aus der Sicht eines Interessenvertreters erklärt: einer bestimmten Person, die nach etwas Bestimmtem suchte. Und das hat funktioniert.

Die Beteiligten waren nicht nur interessiert, sondern auch begeistert. Sie wollten nun den Datenkatalog, weil sie verstanden, dass dieses Tool nicht nur eine Sammlung von ausgefallenen Funktionen für Datenfreaks war. Nein, dieses Tool war etwas viel Grundlegenderes: Der Datenkatalog konnte ihnen helfen, die Daten zu suchen und zu finden, die sie suchten. Ich erklärte, dass ein Datenkatalog, wenn er sorgfältig eingesetzt wird, für viele Beschäftigte in einem Unternehmen von Bedeutung ist. Dieser Ansatz hat für mich und meine Kolleginnen und Kollegen funktioniert, und ich hoffe, dass er auch für dich und deine Kollegen funktioniert.

Am Ende des Tages sind wir alle auf der Suche nach etwas. Und wir suchen die ganze Zeit. Die Sache ist nur, dass es bei der Arbeit sehr schwierig ist, das zu finden, was wir suchen. Und wir nehmen das als etwas Selbstverständliches hin, als etwas, das wir einfach akzeptieren müssen.

Ich gehe davon aus, dass du dieses Buch liest, weil du planst, einen Datenkatalog einzuführen, einen bestehenden zu verbessern, ihn abzuschaffen oder einfach nur zu verstehen versuchst, was für eine Art von Technologie ein Datenkatalog ist: was er tut, wie er verwendet werden sollte und ob er dir auf eine bestimmte Weise helfen kann. Du könntest Teil des Büros des Rechtsberaters, des Chief Data Officer, des Datenschutzbeauftragten oder des Chief Information Officer sein. Du könntest ein Dateningenieur, ein Datenwissenschaftler oder ein Datenmanager sein, oder du gehörst zum Data Governance Team. Dann wird dir dieses Buch helfen zu verstehen, was ein Datenkatalog ist und wie du mit ihm genau das findest, wonach du suchst.

Vielleicht bist du aber auch ein Anbieter von Datenkatalogen. In meinem Buch stelle ich eine Vision für die Zukunft der Datenkataloge vor, von der du bei der Planung der zukünftigen Entwicklung deiner Datenkatalogtechnologie profitieren kannst.

In diesem Buch verwendete Konventionen

In diesem Buch werden die folgenden typografischen Konventionen verwendet:

Kursiv

Weist auf neue Begriffe, URLs, E-Mail-Adressen, Dateinamen und Dateierweiterungen hin.

Constant width

Wird für Programmlistings sowie innerhalb von Absätzen verwendet, um auf Programmelemente wie Variablen- oder Funktionsnamen, Datenbanken, Datentypen, Umgebungsvariablen, Anweisungen und Schlüsselwörter hinzuweisen.

Tipp

Dieses Element steht für einen Tipp oder eine Anregung.

Hinweis

Dieses Element steht für einen allgemeinen Hinweis.

Warnung

Dieses Element weist auf eine Warnung oder einen Warnhinweis hin.

O'Reilly Online Learning

Hinweis

Seit mehr als 40 Jahren bietet O'Reilly Media Schulungen, Wissen und Einblicke in Technologie und Wirtschaft, um Unternehmen zum Erfolg zu verhelfen.

Unser einzigartiges Netzwerk von Experten und Innovatoren teilt sein Wissen und seine Erfahrung durch Bücher, Artikel und unsere Online-Lernplattform. Die Online-Lernplattform von O'Reilly bietet dir On-Demand-Zugang zu Live-Trainingskursen, ausführlichen Lernpfaden, interaktiven Programmierumgebungen und einer umfangreichen Text- und Videosammlung von O'Reilly und über 200 anderen Verlagen. Weitere Informationen erhältst du unter https://oreilly.com.

Wie du uns kontaktierst

Bitte wende dich unter mit Kommentaren und Fragen zu diesem Buch an den Verlag:

  • O'Reilly Media, Inc.
  • 1005 Gravenstein Highway Nord
  • Sebastopol, CA 95472
  • 800-998-9938 (in den Vereinigten Staaten oder Kanada)
  • 707-829-0515 (international oder lokal)
  • 707-829-0104 (Fax)

Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter https://oreil.ly/the_enterprise_data_catalog aufrufen .

Schreib eine E-Mail an , um Kommentare oder technische Fragen zu diesem Buch zu stellen.

Neuigkeiten und Informationen über unsere Bücher und Kurse findest du unter https://oreilly.com.

Du findest uns auf LinkedIn: https://linkedin.com/company/oreilly-media.

Folge uns auf Twitter: https://twitter.com/oreillymedia.

Sieh uns auf YouTube: https://youtube.com/oreillymedia.

Danksagungen

Ich habe das Glück, ein Buch geschrieben zu haben, das von einigen der klügsten Köpfe der Datenbranche durchgesehen, kommentiert und weiterentwickelt wurde. Dieses Buch wurde von Datenpraktikern, Universitätsprofessoren, Industrieforschern, Unternehmern und einigen der brillantesten CEOs der Datenkatalogtechnologiebranche verbessert. Ich habe mein Bestes getan, um dieses Buch zu einer unterhaltsamen, soliden Lektüre zu machen, und wenn du das findest, verdanke ich das in erster Linie den großzügigen und klugen Menschen, die mir auf meinem Weg geholfen haben.

Ich bin den technischen Gutachtern sehr dankbar: Jack Andersen, außerordentlicher Professor, Universität Kopenhagen; Vinoo Ganesh, CEO und Gründer von Efficiently; Ron Itelman, Principal, Clarkston Consulting; Niklas Lagersson, Leiter der Unternehmensarchitektur, GN Store Nord; und Jessica Talisman, Senior Manager, Taxonomie, bei System1. Dank ihrer durchdachten, präzisen Kommentare, die auf akademischem, praktischem und technischem Fachwissen basieren, ist mein Buch besser geworden, als ich es mir erhoffen konnte.

Mein guter Freund Juan Sequeda, Principal Scientist bei data.world, hat sich mit mir in Chats auf LinkedIn, Zoom und am Telefon in der U-Bahn, im Auto, am Flughafen und von zu Hause aus über Daten, Wissen und Datenkataloge unterhalten. Er ist ein Lehrer und ein wahrer intellektueller Akademiker mit einem unermüdlich denkenden Gehirn und einem großen Herzen. Juan, dich und Professor George Fletcher in Paris zu treffen, hat so viel Spaß gemacht und den Geist angeregt!

Auf dem Data Innovation Summit 2022 in Stockholm traf ich Luc Legardeur, CEO von Zeenea, und Petter Tønnessen, Leiter der nordischen Aktivitäten, beide von Zeenea. Später trafen wir uns in Paris erneut mit dem CEO von Zeenea, Guillaume Bodet. In den Cafés von Paris über Weltpolitik, europäische Geschichte, Daten und mein Buch zu diskutieren, war außergewöhnlich.

Dass ein weltweit führender Experte für Datenabstammung wie Tomas Kratky, Gründer und CEO von MANTA - dem Nikola Tesla der Daten - mein Manuskript gelesen hat, war eine Herausforderung und hat mein Buch verbessert. Danke, Tomas, das war sehr großzügig von dir.

Danke an Prukalpa Sankar, den Mitbegründer von Atlan, für die Kommentierung und Durchsicht meines Manuskripts. Jedes Unternehmen sollte seine Metadaten aktivieren, und Datenkataloge müssen dabei helfen, genau das zu tun!

Vielen Dank an Shinji Kim, den Gründer und CEO von Select Star, und Inna Tokarev Sela, die Gründerin und CEO von illumex, für die Gespräche über ihre erstklassige Technologie und mein Buch.

Shirshanka Das, Mitbegründerin und CEO von Acryl Data, hat sich die Zeit genommen, mir die Wunder von Streaming-basierten Datenkatalogen im Detail zu erklären und mir hilfreiches Feedback zu meinem Manuskript gegeben - vielen Dank, Shirshanka.

Awais Ahsan, Senior Vice President, und Mitesh Shah, Vice President, beide von Alation - wir haben uns gut über mein Manuskript ausgetauscht, mehr dazu in Kürze. Vielen Dank an euch!

Eric Broda, Senior Technology Executive, hat uns geholfen, den Zusammenhang zwischen Datenkatalogen und Datengeflechten zu erläutern; vielen Dank dafür!

Ich habe auch gutes Feedback von Piethein Strengholt, Andy Petrella, Xavier de Boisredon, Benjamin Rogojan, Chad Sanderson, Girish Kurup, Fabiola Aparecida Vizentim und Elie Perelman erhalten.

Danke an die Podcaster, dass ich dabei sein durfte! Scott Hirleman bei Data Mesh Radio, Loris Marini bei Discovering Data, Winfried Adalbert Etzel bei MetaDAMA, Juan Sequeda (ja, er schon wieder!) und Tim Gasper bei Catalog and Cocktails, Joe Reis und Matt Housley beim Monday Morning Data Chat und Jocelyn Byrne Houle bei Softwareentwicklung Daily. Ihr alle bildet so viele Menschen weiter - macht weiter so!

Danke an das Redaktionsteam von O'Reilly: meine Akquisitionsredakteure Aaron Black, Jess Haberman und Jon Hassell, meine Entwicklungsredakteurin Rita Fernando und meine Produktionsredakteure Clare Laylock und Katherine Tozer. Sie haben meine Ideen geformt, verfeinert und vervollständigt und sie in ein Buch verwandelt. Die Zusammenarbeit mit meinen Redakteuren war eine der professionellsten Erfahrungen in meiner Karriere; O'Reilly kann sich glücklich schätzen, sie zu haben. Sie sind begabte, freundliche Menschen.

Schließlich meine Familie. Meine strahlende, wunderschöne Frau Christina Eriksen, du bist die Liebe meines Lebens, und meine Kinder Lili und Louis, ihr seid wirklich wunderbare Kinder. Ich danke euch allen, dass ihr mir die Zeit gegeben habt, dieses Buch zu schreiben.

Und wenn ich dich nicht erwähnt habe, heißt das nicht, dass du vergessen wurdest! Ich danke dir!

Get Der Unternehmensdatenkatalog now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.