Kapitel 6. Identitätsoffenlegung in synthetischen Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Die Analyse von Datenschutzrisiken bei synthetischen Daten bleibt ein wichtiges Thema. Im Rahmen einer Datenschutzanalyse geht es hier um Daten, die sich auf Personen beziehen. Wenn sich die Daten nicht auf Einzelpersonen beziehen, gibt es keine Datenschutzbedenken. Wenn sich die Daten zum Beispiel auf Rezepte oder Autos beziehen, würden wir uns nicht so viele Gedanken über den Datenschutz machen. Die Datensynthese wird jedoch ausgiebig genutzt, um Daten über Einzelpersonen zu generieren, und deshalb müssen wir uns über die Auswirkungen auf den Datenschutz im Klaren sein.

Allgemein wird angenommen, dass synthetische Daten ein vernachlässigbares Risiko für die Privatsphäre darstellen, weil es keine eindeutige Zuordnung zwischen den Datensätzen in den synthetischen Daten und den Datensätzen in den Originaldaten gibt.1 Reiter stellte fest, dass "die Identifizierung von Einheiten und ihren sensiblen Daten aus synthetischen Stichproben nahezu unmöglich ist".2 und Taub et al. erklärten, dass "es allgemein anerkannt ist, dass es nicht sinnvoll ist, das Risiko synthetischer Daten als Re-Identifizierung zu betrachten, wie es viele andere SDC-Methoden tun".3

In der Praxis ist es bei der Generierung synthetischer Daten jedoch möglich, das Synthesemodell zu stark an die realen Daten anzupassen, was wir ...

Get Praktische Erzeugung synthetischer Daten now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.