Vorwort

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Ziele

Ziel dieses Buches ist es, dich mit den Konzepten, Techniken und Werkzeugen für Graphen-Datenstrukturen, Graph-Analytik und maschinelles Lernen vertraut zu machen. Wir hoffen, dass du am Ende des Buches verstehst, wie Graphenanalyse zur Lösung einer Reihe von realen Problemen eingesetzt werden kann. Wir möchten, dass du in der Lage bist, Fragen wie die folgenden zu beantworten: Ist der Graph für diese Aufgabe geeignet? Welche Tools und Techniken sollte ich verwenden? Welche sinnvollen Beziehungen gibt es in meinen Daten und wie formuliere ich eine Aufgabe in Bezug auf die Beziehungsanalyse?

Wir haben die Erfahrung gemacht, dass viele Menschen das allgemeine Konzept und die Struktur von Graphen schnell begreifen, aber es braucht mehr Mühe und Erfahrung, um "grafisch zu denken", d.h. ein Gespür dafür zu entwickeln, wie man seine Daten am besten als Graphen modelliert und dann eine analytische Aufgabe als Graphenabfrage formuliert. Jedes Kapitel beginnt mit einer Liste seiner Ziele. Die Ziele lassen sich in drei allgemeine Bereiche einteilen: Konzepte über Graphenanalyse und maschinelles Lernen lernen, bestimmte Probleme mit Graphenanalyse lösen und verstehen, wie man die Abfragesprache GSQL und die Graphenplattform TigerGraph verwendet.

Zielgruppe und Voraussetzungen

Wir haben dieses Buch für alle konzipiert, die sich für Datenanalyse interessieren und etwas über Graph Analytics lernen wollen. Du musst kein ernsthafter Programmierer oder Datenwissenschaftler sein, aber ein gewisses Maß an Kenntnissen über Datenbanken und Programmierkonzepte wird dir definitiv helfen, den Präsentationen zu folgen. Wenn wir einige Graphenalgorithmen und Techniken des maschinellen Lernens vertiefen, stellen wir einige mathematische Gleichungen vor, die Mengen, Summation und Grenzen beinhalten. Diese Gleichungen sind jedoch nur eine Ergänzung zu unseren Erklärungen mit Worten und Zahlen.

In den Kapiteln zu den Anwendungsfällen werden wir vorgefertigten GSQL-Code auf der TigerGraph Cloud-Plattform ausführen. Du brauchst nur einen Computer und einen Internetzugang. Wenn du mit der Datenbankabfragesprache SQL und einer gängigen Programmiersprache vertraut bist, wirst du einen Großteil des GSQL-Codes verstehen können. Wenn nicht, kannst du einfach den Anweisungen folgen und die vorgefertigten Anwendungsbeispiele ausführen, während du den Kommentaren im Buch folgst.

Ansatz und Fahrplan

Unser Ziel ist es, das Material so zu präsentieren, dass es von den realen Bedürfnissen der Datenanalyse motiviert ist, im Gegensatz zu den theoretischen Prinzipien. Wir versuchen immer, die Dinge so einfach wie möglich zu erklären und verwenden alltägliche Konzepte anstelle von Fachjargon.

Die GSQL-Sprache wird durch vollständige Beispiele eingeführt. Zu Beginn des Buches beschreiben wir Zeile für Zeile den Zweck und die Funktion der einzelnen Zeilen. Außerdem heben wir Sprachstrukturen, Syntax und Semantik hervor, die besonders wichtig sind. Für ein umfassendes Tutorial zu GSQL kannst du über dieses Buch hinaus auf weitere Ressourcen zurückgreifen.

Dieses Buch ist in drei Teile gegliedert: Teil I: Verbinden; Teil II: Analysieren; und Teil III: Lernen. Jeder Teil besteht aus zwei Arten von Kapiteln. Das erste ist ein Konzeptkapitel, gefolgt von zwei oder drei Kapiteln mit Anwendungsfällen zu TigerGraph Cloud und GSQL.

Kapitel Format Titel
1 Einführung Verbindungen sind alles
Teil I: Verbinden
2 Konzept Daten verbinden und erforschen
3 Anwendungsfall, Einführung in TigerGraph Sieh deine Kunden und dein Geschäft besser: 360-Grafiken
4 Anwendungsfall Studieren von Startup-Investitionen
5 Anwendungsfall Aufdeckung von Betrugs- und Geldwäschemustern
Teil II: Analysieren
6 Konzept Analyse von Verbindungen für tiefere Einblicke
7 Anwendungsfall Bessere Empfehlungen und Weiterempfehlungen
8 Anwendungsfall Stärkung der Cybersicherheit
9 Anwendungsfall Flugrouten von Fluggesellschaften analysieren
Teil III: Lernen
10 Konzept Methoden des maschinellen Lernens auf der Basis von Graphen
11 Anwendungsfall Entity Resolution Revisited
12 Anwendungsfall, Einführung in die Machine Learning Workbench Verbesserung der Betrugsaufdeckung

In diesem Buch verwendete Konventionen

In diesem Buch werden die folgenden typografischen Konventionen verwendet:

Kursiv

Weist auf neue Begriffe, URLs, E-Mail-Adressen, Dateinamen und Dateierweiterungen hin.

Constant width

Wird für Programmlistings sowie innerhalb von Absätzen verwendet, um auf Programmelemente wie Variablen- oder Funktionsnamen, Datenbanken, Datentypen, Umgebungsvariablen, Anweisungen und Schlüsselwörter hinzuweisen.

Constant width bold

Gibt den Typ der Scheitelpunkte oder Kanten an.

Tipp

Dieses Element steht für einen Tipp oder eine Anregung.

Hinweis

Dieses Element steht für einen allgemeinen Hinweis.

Warnung

Dieses Element weist auf eine Warnung oder einen Warnhinweis hin.

Code-Beispiele verwenden

Dieses Buch hat sein eigenes GitHub-Repository unter https://github.com/TigerGraph-DevLabs/Book-graph-powered-analytics.

Der erste Inhalt dieser Seite werden Kopien aller Anwendungsbeispiele sein. Außerdem werden wir die GSQL-Tipps aus dem Buch in einem Dokument zusammenfassen, das als Fibel dient. Sobald wir Feedback von den Lesern erhalten (und wir hoffen, dass wir von dir hören!), werden wir Antworten auf häufig gestellte Fragen veröffentlichen. Wir werden auch zusätzliche oder geänderte GSQL-Beispiele hinzufügen oder aufzeigen, wie du die neuen Möglichkeiten der TigerGraph-Plattform nutzen kannst.

Weitere Ressourcen zu TigerGraph und der Sprache GSQL findest du auf der TigerGraph-Hauptseite(https://www.tigergraph.com), der Dokumentationsseite(https://docs.tigergraph.com) oder dem YouTube-Kanal(https://www.youtube.com/@TigerGraph).

Du kannst die Autoren unter gpaml.book@gmail.com kontaktieren .

O'Reilly Online Learning

Hinweis

Seit mehr als 40 Jahren bietet O'Reilly Media Schulungen, Wissen und Einblicke in Technologie und Wirtschaft, um Unternehmen zum Erfolg zu verhelfen.

Unser einzigartiges Netzwerk von Experten und Innovatoren teilt sein Wissen und seine Erfahrung durch Bücher, Artikel und unsere Online-Lernplattform. Die Online-Lernplattform von O'Reilly bietet dir On-Demand-Zugang zu Live-Trainingskursen, ausführlichen Lernpfaden, interaktiven Programmierumgebungen und einer umfangreichen Text- und Videosammlung von O'Reilly und über 200 anderen Verlagen. Weitere Informationen erhältst du unter https://oreilly.com.

Wie du uns kontaktierst

Bitte richte Kommentare und Fragen zu diesem Buch an den Verlag:

Wir haben eine Webseite für dieses Buch, auf der wir Errata, Beispiele und zusätzliche Informationen auflisten. Du kannst diese Seite unter https://oreil.ly/gpaml aufrufen .

Neuigkeiten und Informationen über unsere Bücher und Kurse findest du unter https://oreilly.com.

Finde uns auf LinkedIn: https://linkedin.com/company/oreilly-media

Folge uns auf Twitter: https://twitter.com/oreillymedia

Schau uns auf YouTube: https://youtube.com/oreillymedia

Danksagungen

Dieses Buch gäbe es nicht ohne Gaurav Deshpande, VP of Marketing bei TigerGraph, der vorgeschlagen hat, dass wir es schreiben sollten und könnten. Er schrieb den ursprünglichen Vorschlag und die Kapitelgliederung; die dreiteilige Struktur ist seine Idee. Vielen Dank an den CEO und Gründer von TigerGraph, Dr. Yu Xu, der unsere Bemühungen unterstützt und uns die nötige Flexibilität für die Arbeit an diesem Projekt gewährt hat. Dr. Xu hatte auch die Idee zu GraphStudio und seinen Starter Kits. Mingxi Wu und Alin Deutsch entwickelten die GSQL-Sprache mit dem Ziel einer effizienten Graph-Analyse.

Neben den offiziellen Autorinnen und Autoren haben auch andere zum Material in diesem Buch beigetragen. Tom Reeve hat uns mit seinen professionellen Schreibfähigkeiten und seinem Wissen über grafische Konzepte beim Schreiben von Kapitel 2 geholfen, als Schreibblockade und Prokrastination unser größter Feind zu sein schienen. Emily McAuliffe und Amanda Morris haben einige der Abbildungen in der Early Release-Ausgabe des Buches entworfen. Wir brauchten einige Datenwissenschaftler, um unsere Kapitel über maschinelles Lernen zu überprüfen. Wir wandten uns an Parker Erickson und Bill Shi, die nicht nur Experten im maschinellen Lernen von Graphen sind, sondern auch die TigerGraph ML Workbench entwickelt haben.

Wir sind Xinyu Chang, dem ursprünglichen Experten für GSQL-Abfragen und -Lösungen von TigerGraph, zu Dank verpflichtet, da er viele der Anwendungsfall-Starterkits und Graphalgorithmus-Implementierungen in diesem Buch entwickelt bzw. deren Entwicklung beaufsichtigt hat. Yiming Pan hat ebenfalls mehrere Graphenalgorithmen und Abfragen geschrieben oder optimiert. Viele der Beispiele in diesem Buch basieren auf Entwürfen, die sie für Kunden von TigerGraph entwickelt haben. Die Schemata, Abfragen und Ausgabedarstellungen in diesen Starterkits sind genauso Teil des Inhalts dieses Buches wie die englischen Absätze. Wir haben einige Verbesserungen an den Starter Kits vorgenommen, um sie für dieses Buch anzupassen. Eine Reihe von Personen hat bei der Überprüfung und Standardisierung der Starterkits geholfen: Jon Herke, Head of Developer Relations, und mehrere TigerGraph-Praktikanten: Abudula Aisikaer, Shreya Chaudhary, McKenzie Steenson und Kristine Zheng. Renchu Song und Duc Le, die das Design und die Entwicklung von TigerGraph Cloud und GraphStudio leiten, stellten sicher, dass unsere überarbeiteten Starter Kits in das Produkt aufgenommen wurden.

Ein großes Dankeschön an unsere beiden Entwicklungsredakteure bei O'Reilly. Nicole Taché hat uns den Weg gezeigt und uns mit aufschlussreichen Kommentaren, Ratschlägen und Ermutigungen für dieses Projekt zu unserer ersten frühen Veröffentlichung von zwei Kapiteln verholfen. Gary O'Brien hat uns von da an bis zur Fertigstellung durch dick und dünn begleitet. Beide sind wunderbare Redakteure, mit denen zu arbeiten ein Vergnügen und eine Ehre war. Vielen Dank auch an unseren Produktionsredakteur Jonathon Owen und unseren Lektor Adam Lawrence.

Victor möchte sich bei seinen Eltern George und Sylvia Lee für ihre unermüdliche Unterstützung seiner akademischen und nichtakademischen Aktivitäten bedanken. Seiner Frau Susan Haddox dankt er dafür, dass sie immer für ihn da war, dass sie es ertragen hat, dass er bis spät in die Nacht geschrieben hat, dass sie mit ihm Star Trek geschaut hat und dass sie ihm vorgemacht hat, wie man verdammt klug, freundlich und lustig sein kann.

Kien möchte seiner Mutter My Linh Ly dafür danken, dass sie eine ständige Quelle der Inspiration und eine treibende Kraft für seine Karriere ist. Er ist auch seiner Frau Sammy Wai-lok Lee dankbar, die immer für ihn da war, seinem Leben Farbe verlieh und sich um ihn und ihre kleine Tochter Liv Vy Ly Nguyen-Lee kümmerte, die während der Arbeit an diesem Buch geboren wurde.

Alex möchte seinen Eltern, Chris und Becky Thomas, und seiner Schwester Ari für ihre Unterstützung und Ermutigung als Diskussionspartner während des Schreibprozesses danken. Ein besonderer Dank geht an seine Frau Gloria Zhang für ihre unglaubliche Stärke, ihre enorme Intelligenz und ihre grenzenlose Inspirationsfähigkeit.

Get Graphengestützte Analysen und maschinelles Lernen mit TigerGraph now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.