KAPITEL 10

Relationale Daten mit dplyr

Einführung

Selten ist bei einer Datenanalyse nur eine einzige Datentabelle beteiligt. In der Regel haben Sie es mit vielen Datentabellen zu tun, und Sie müssen sie miteinander verknüpfen, um die anstehenden Fragen zu beantworten. Man spricht hierbei von relationalen Daten, weil ihre Beziehungen (Relationen) zueinander und nicht nur die individuellen Datensets wichtig sind.

Beziehungen werden immer zwischen einem Paar von Tabellen definiert. Alle anderen Beziehungen bauen auf diesem einfachen Konzept auf: Die Beziehungen von drei oder mehr Tabellen sind immer eine Eigenschaft der Beziehungen zwischen jedem Paar. Manchmal können beide Elemente eines Paars dieselbe Tabelle sein! Dies ist zum Beispiel notwendig, ...

Get R für Data Science now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.