Book description
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Um Modelle für maschinelles Lernen zu entwickeln und zu testen, brauchst du Zugang zu großen und vielfältigen Daten. Aber wo kannst du brauchbare Datensätze finden, ohne in Datenschutzprobleme zu geraten? In diesem praktischen Buch werden Techniken zur Erzeugung synthetischer Daten - also gefälschter Daten, die aus echten Daten generiert werden - vorgestellt, damit du Sekundäranalysen durchführen kannst, um zu forschen, das Kundenverhalten zu verstehen, neue Produkte zu entwickeln oder neue Einnahmen zu generieren.
Datenwissenschaftler/innen werden lernen, wie die Generierung synthetischer Daten eine Möglichkeit darstellt, solche Daten für sekundäre Zwecke breit verfügbar zu machen und gleichzeitig viele Datenschutzbedenken zu berücksichtigen. Analysten lernen die Prinzipien und Schritte zur Erzeugung synthetischer Daten aus realen Datensätzen kennen. Und Führungskräfte aus der Wirtschaft erfahren, wie synthetische Daten dazu beitragen können, die Zeit bis zur Einführung eines Produkts oder einer Lösung zu verkürzen.
Dieses Buch beschreibt:
- Schritte zur Erzeugung synthetischer Daten mit multivariaten Normalverteilungen
- Methoden zur Verteilungsanpassung mit verschiedenen Anpassungsgütekriterien
- Wie man die einfache Struktur der Originaldaten repliziert
- Ein Ansatz zur Modellierung der Datenstruktur, um komplexe Beziehungen zu berücksichtigen
- Mehrere Ansätze und Kennzahlen, mit denen du den Nutzen von Daten bewerten kannst
- Wie Analysen, die mit echten Daten durchgeführt wurden, mit synthetischen Daten repliziert werden können
- Auswirkungen synthetischer Daten auf den Datenschutz und Methoden zur Bewertung der Identitätsoffenlegung
Table of contents
- Vorwort
- 1. Einführung in die Erzeugung synthetischer Daten
- 2. Implementierung der Datensynthese
- 3. Erste Schritte: Verteilungsanpassung
- 4. Bewertung der Nützlichkeit synthetischer Daten
- 5. Methoden zur Synthese von Daten
- 6. Identitätsoffenlegung in synthetischen Daten
-
7. Praktische Datensynthese
- Datenkomplexität verwalten
-
Organisieren der Datensynthese
- Rechenleistung
- Ein Werkzeugkasten voller Techniken
- Synthese von Kohorten im Vergleich zu vollständigen Datensätzen
- Kontinuierliche Dateneinspeisung
- Datenschutzgarantie als Zertifizierung
- Durchführung von Validierungsstudien, um Zustimmung zu erhalten
- Tests für motivierte Eindringlinge
- Wem gehören die synthetischen Daten?
- Schlussfolgerungen
- Index
Product information
- Title: Praktische Erzeugung synthetischer Daten
- Author(s):
- Release date: October 2024
- Publisher(s): O'Reilly Media, Inc.
- ISBN: 9798341604186
You might also like
book
Learn to Solder
Learn the fundamentals of soldering—and pick up an essential skill for building electronic gadgets. You’ll discover …
article
Twenty Years of Open Innovation
Organizations that practice open innovation draw on external resources to develop new ideas for products and …
article
Run Llama-2 Models Locally with llama.cpp
Llama is Meta’s answer to the growing demand for LLMs. Unlike its well-known technological relative, ChatGPT, …
article
Use Github Copilot for Prompt Engineering
Using GitHub Copilot can feel like magic. The tool automatically fills out entire blocks of code--but …