Book description
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Deine Trainingsdaten haben genauso viel mit dem Erfolg deines Datenprojekts zu tun wie die Algorithmen selbst, denn die meisten Fehlschläge bei KI-Systemen hängen mit den Trainingsdaten zusammen. Obwohl Trainingsdaten die Grundlage für erfolgreiches KI und maschinelles Lernen sind, gibt es nur wenige umfassende Ressourcen, die dir dabei helfen, den Prozess zu meistern.
In diesem praktischen Leitfaden zeigt der Autor Anthony Sarkis - leitender Ingenieur für die KI-Trainingsdatensoftware Diffgram - technischen Fachkräften, Managern und Fachexperten, wie sie mit Trainingsdaten arbeiten und diese skalieren können, und beleuchtet gleichzeitig die menschliche Seite der Überwachung von Maschinen. Technische Führungskräfte, Dateningenieure und Data-Science-Profis erhalten ein solides Verständnis der Konzepte, Tools und Prozesse, die sie für den erfolgreichen Umgang mit Trainingsdaten benötigen.
In diesem Buch lernst du, wie du:
- Effektiv mit Trainingsdaten arbeiten, einschließlich Schemata, Rohdaten und Kommentaren
- deine Arbeit, dein Team oder dein Unternehmen stärker auf KI/ML-Daten ausrichten kannst
- Trainingsdatenkonzepte anderen Mitarbeitern, Teammitgliedern und Stakeholdern klar und deutlich zu erklären
- Trainingsdaten für produktionsreife KI-Anwendungen entwerfen, bereitstellen und ausliefern
- neue, auf Trainingsdaten basierende Fehlermöglichkeiten wie Datenverzerrungen zu erkennen und zu korrigieren
- Automatisierungen sicher nutzen, um Trainingsdaten effektiver zu erstellen
- Schulungsdatensysteme erfolgreich pflegen, betreiben und verbessern
Table of contents
- Vorwort
- 1. Trainingsdaten Einführung
- 2. Aufstehen und loslegen
-
3. Schema
- Schema Deep Dive Einführung
- Labels und Attribute - was ist das?
- Räumliche Repräsentation - wo ist sie?
- Beziehungen, Sequenzen, Zeitreihen: Wann ist es soweit?
- Leitfäden und Anleitungen
- Beziehung zwischen den Aufgaben des maschinellen Lernens und den Trainingsdaten
- Allgemeine Konzepte
- Zusammenfassung
- 4. Datentechnik
- 5. Arbeitsablauf
-
6. Theorien, Konzepte und Wartung
- Einführung
- Theorien
-
Allgemeine Konzepte
- Relevanz der Daten
- Bedarf an qualitativen und quantitativen Evaluierungen
- Wiederholungen
- Prioritäten setzen: Was man kennzeichnen sollte
- Die Beziehung von Transfer Learning zu Datensätzen (Feinabstimmung)
- Pro-Probe-Entscheidungen
- Ethische Erwägungen und Datenschutz
- Bias
- Vorurteile sind schwer zu überwinden
- Metadaten
- Verhindern des Verlusts von Metadaten
- Zug/Val/Test ist die Kirsche auf dem Sahnehäubchen
- Mustererstellung
- Wartung
- Ausbildung Datenmanagement
- Zusammenfassung
-
7. KI-Transformation und Anwendungsfälle
- Einführung
-
KI-Transformation
- Deine alltägliche Arbeit als Annotation sehen
- Die kreative Revolution der datenzentrierten KI
- Du kannst neue Daten erstellen
- Du kannst ändern, welche Daten du sammelst
- Du kannst die Bedeutung der Daten ändern
- Du kannst schaffen!
- Think Step Funktionsverbesserung für Großprojekte
- Baue deine KI-Daten auf, um deine KI-Gegenwart und Zukunft zu sichern
- Ernenne eine Führungskraft: Der Direktor für KI-Daten
- Use Case Discovery
- Das neue "Crowd Sourcing": Deine eigenen Experten
- Moderne Tools für Ausbildungsdaten
- Zusammenfassung
-
8. Automatisierung
- Einführung
- Erste Schritte
- Kompromisse
- Pre-Labeling
-
Interaktive Automatisierung von Kommentaren
- Eigenes schaffen
- Hinweise zur technischen Einrichtung
- Was ist ein Beobachter? (Beobachter-Muster)
- Wie man einen Beobachter benutzt
- Interaktives Erfassen einer Region von Interesse
- Interaktives Zeichnen von Box zu Polygon mit GrabCut
- Beispiel für die Vorhersage eines Vollbildmodells
- Beispiel: Personendetektion für verschiedene Attribute
- Automatisierung der Qualitätssicherung
- Datenentdeckung: Was man kennzeichnen sollte
- Augmentation
- Simulation und synthetische Daten
- Medienspezifisch
- Bereichsspezifisch
- Zusammenfassung
- 9. Fallstudien und Geschichten
- Index
- Über den Autor
Product information
- Title: Trainingsdaten für maschinelles Lernen
- Author(s):
- Release date: October 2024
- Publisher(s): O'Reilly Media, Inc.
- ISBN: 9798341604452
You might also like
book
Datos de entrenamiento para el aprendizaje automático
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com Tus datos de …
article
Reinventing the Organization for GenAI and LLMs
Previous technology breakthroughs did not upend organizational structure, but generative AI and LLMs will. We now …
article
Three Lessons From Chatting About Strategy With ChatGPT
Large language models like ChatGPT are generating excitement about their potential use cases. A pair of …
book
IBM Cloud Private Application Developer's Guide
IBM® Cloud Private is an application platform for developing and managing containerized applications across hybrid cloud …