Praktische Erzeugung synthetischer Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com Um Modelle für maschinelles Lernen zu entwickeln und zu testen, brauchst du Zugang zu großen und vielfältigen Daten. Aber wo kannst du brauchbare Datensätze finden,...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Khaled El Emam, Richard Hoptroff, Lucy Mosquera
Format: Buch
Sprache:ger
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com Um Modelle für maschinelles Lernen zu entwickeln und zu testen, brauchst du Zugang zu großen und vielfältigen Daten. Aber wo kannst du brauchbare Datensätze finden, ohne in Datenschutzprobleme zu geraten? In diesem praktischen Buch werden Techniken zur Erzeugung synthetischer Daten - also gefälschter Daten, die aus echten Daten generiert werden - vorgestellt, damit du Sekundäranalysen durchführen kannst, um zu forschen, das Kundenverhalten zu verstehen, neue Produkte zu entwickeln oder neue Einnahmen zu generieren. Datenwissenschaftler/innen werden lernen, wie die Generierung synthetischer Daten eine Möglichkeit darstellt, solche Daten für sekundäre Zwecke breit verfügbar zu machen und gleichzeitig viele Datenschutzbedenken zu berücksichtigen. Analysten lernen die Prinzipien und Schritte zur Erzeugung synthetischer Daten aus realen Datensätzen kennen. Und Führungskräfte aus der Wirtschaft erfahren, wie synthetische Daten dazu beitragen können, die Zeit bis zur Einführung eines Produkts oder einer Lösung zu verkürzen. Dieses Buch beschreibt: Schritte zur Erzeugung synthetischer Daten mit multivariaten Normalverteilungen Methoden zur Verteilungsanpassung mit verschiedenen Anpassungsgütekriterien Wie man die einfache Struktur der Originaldaten repliziert Ein Ansatz zur Modellierung der Datenstruktur, um komplexe Beziehungen zu berücksichtigen Mehrere Ansätze und Kennzahlen, mit denen du den Nutzen von Daten bewerten kannst Wie Analysen, die mit echten Daten durchgeführt wurden, mit synthetischen Daten repliziert werden können Auswirkungen synthetischer Daten auf den Datenschutz und Methoden zur Bewertung der Identitätsoffenlegung