Kapitel 7. Mit derÄnderungsdatenerfassung erfasste Produktänderungen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Das Betriebsteam von AATD kann sich jetzt einen soliden Überblick über die Anzahl der Bestellungen und die Einnahmen des Unternehmens verschaffen. Was fehlt, ist, dass sie nicht wissen, was auf Produktebene passiert. Beschwerden aus anderen Bereichen des Unternehmens deuten darauf hin, dass es bei einigen Produkten zu einem Anstieg der Bestellungen kommt, während bei anderen Artikeln zu viel auf Lager ist.

Die Daten über die einzelnen Produkte sind derzeit in der MySQL-Datenbank gespeichert, aber wir müssen sie von dort in unsere Echtzeit-Analyse-Architektur übertragen. In diesem Kapitel lernen wir, wie wir das mit einer Technik namens Change Data Capture (CDC) tun können.

Erfassen von Änderungen aus operativen Datenbanken

Unternehmen zeichnen ihre Transaktionen oft in operativen oder OLTP Datenbanken auf. Die Unternehmen wollen ihre operativen Daten oft analysieren, aber wie sollen sie das tun?

Traditionell wurden ETL-Pipelines verwendet, um Daten aus operativen Datenbanken in analytische Datenbanken wie Data Warehouses zu verschieben. Diese Pipelines wurden regelmäßig ausgeführt und extrahierten Daten aus den Quelldatenbanken in großen Stapeln. Anschließend wurden die Daten transformiert, bevor sie in die analytische Datenbank geladen wurden.

Das Problem bei diesem klassischen ...

Get Aufbau von Echtzeit-Analysesystemen now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.