book

Maschinelle Lernsysteme entwerfen

Name: Maschinelle Lernsysteme entwerfen
Author: Chip Huyen
ISBN: 9781098180331

by Chip Huyen

August 2024

Intermediate to advanced

388 pages

13h 8m

German

O'Reilly Media, Inc.

Read now

Unlock full access

Vorwort
Für wen dieses Buch istWas dieses Buch nicht istNavigieren in diesem BuchGitHub Repository und GemeinschaftIn diesem Buch verwendete KonventionenCode-Beispiele verwendenO'Reilly Online LearningWie du uns kontaktierstDanksagungen
1. Überblick über maschinelle Lernsysteme
Wann wird maschinelles Lernen eingesetzt?Anwendungsfälle für maschinelles LernenMaschinelle Lernsysteme verstehenMaschinelles Lernen in der Forschung vs. in der ProduktionMaschinelle Lernsysteme im Vergleich zu traditioneller SoftwareZusammenfassung
2. Einführung in das Design maschineller Lernsysteme
Geschäfts- und ML-ZieleAnforderungen für ML-SystemeVerlässlichkeitSkalierbarkeitInstandhaltbarkeitAnpassungsfähigkeitIterativer ProzessML-Probleme einrahmenArten von ML-AufgabenObjektive FunktionenGeist versus DatenZusammenfassung
3. Grundlagen der Datentechnik
DatenquellenDatenformateJSONZeilen-Hauptformat vs. Spalten-HauptformatText vs. BinärformatDatenmodelleRelationales ModellNoSQLStrukturierte versus unstrukturierte DatenEngines für die Speicherung und Verarbeitung von DatenTransaktionale und analytische VerarbeitungETL: Extrahieren, Transformieren und LadenModi des DatenflussesDatenübermittlung durch DatenbankenDatenweitergabe durch DiensteDatenübermittlung durch Echtzeit-TransportStapelverarbeitung vs. Stream ProcessingZusammenfassung
4. Trainingsdaten
ProbenahmeNichtwahrscheinlichkeitsstichprobenEinfache ZufallsstichprobeStratifizierte StichprobenGewichtetes SamplingProbenahme im StauseeWichtigkeitsstichprobenKennzeichnungHandetikettenNatürliche EtikettenUmgang mit dem Mangel an EtikettenUngleichgewicht der KlassenHerausforderungen des KlassenungleichgewichtsUmgang mit KlassenungleichgewichtenDatenerweiterungEinfache Label-erhaltende TransformationenPerturbationDatensyntheseZusammenfassung
5. Feature Engineering
Gelernte Merkmale versus konstruierte MerkmaleGemeinsame Vorgänge bei der Feature-EntwicklungUmgang mit fehlenden WertenSkalierungDiskretisierungKodierung kategorischer MerkmaleMerkmal KreuzungDiskrete und kontinuierliche PositionseinbettungenDatenleckageHäufige Ursachen für DatenlecksDatenlecks aufspürenGute technische EigenschaftenMerkmal WichtigkeitMerkmal VerallgemeinerungZusammenfassung
6. Modellentwicklung und Offline-Bewertung
Modellentwicklung und SchulungML-Modelle auswertenEnsemblesNachverfolgung und Versionierung von ExperimentenVerteilte AusbildungAutoMLModell Offline-BewertungGrundlinienBewertungsmethodenZusammenfassung
7. Modellbereitstellung und Vorhersagedienst
Mythen über den Einsatz von maschinellem LernenMythos 1: Man setzt nur ein oder zwei ML-Modelle gleichzeitig einMythos 2: Wenn wir nichts tun, bleibt die Leistung des Modells gleichMythos 3: Du wirst deine Modelle nicht so oft aktualisieren müssenMythos 4: Die meisten ML-Ingenieure müssen sich nicht um die Skalierung kümmernBatch-Vorhersage vs. Online-VorhersageVon der Batch-Vorhersage zur Online-VorhersageVereinheitlichung von Batch Pipeline und Streaming PipelineModell KomprimierungLow-Rank-FaktorisierungWissensdestillationBeschneidenQuantisierungML in der Cloud und am Rande der WeltKompilieren und Optimieren von Modellen für KantengeräteML in BrowsernZusammenfassung
8. Verschiebung der Datenverteilung und Überwachung
Ursachen für ML-SystemausfälleSoftware SystemausfälleML-spezifische AusfälleDatenverteilung verschiebt sichArten von DatenverschiebungenAllgemeine DatenverteilungsschichtenErkennen von Verschiebungen in der DatenverteilungUmgang mit Verschiebungen in der DatenverteilungÜberwachung und BeobachtbarkeitML-spezifische MetrikenMonitoring ToolboxBeobachtbarkeitZusammenfassung
9. Kontinuierliches Lernen und Testen in der Produktion
Kontinuierliches LernenZustandslose Umschulung versus zustandsorientierte AusbildungWarum kontinuierliches Lernen?Kontinuierliche LernherausforderungenVier Stufen des kontinuierlichen LernensWie oft du deine Modelle aktualisieren solltestTest in der ProduktionShadow DeploymentA/B-TestsKanarienvogel-FreigabeExperimente zur VerschachtelungBanditenZusammenfassung

10. Infrastruktur und Hilfsmittel für MLOps
Speicherung und RechenleistungÖffentliche Cloud vs. private RechenzentrenEntwicklungsumgebungEinrichtung der EntwicklungsumgebungStandardisierung von EntwicklungsumgebungenVon Dev zu Prod: ContainerRessourcenmanagementCron, Zeitplanungsprogramme und OrchestratorenData Science Workflow ManagementML PlattformModel DeploymentModel StoreFeature StoreBauen versus KaufenZusammenfassung
11. Die menschliche Seite des maschinellen Lernens
BenutzererfahrungKonsistenz der Nutzererfahrung sicherstellenBekämpfung von "größtenteils korrekten" VorhersagenGlattes FehlschlagenTeamstrukturFunktionsübergreifende Teams ZusammenarbeitEnd-to-End-DatenwissenschaftlerVerantwortungsvolle KIUnverantwortliche KI: FallstudienEin Rahmen für verantwortungsvolle KIZusammenfassung
Epilog
Index
Über den Autor

Content preview from Maschinelle Lernsysteme entwerfen

Kapitel 5. Feature Engineering

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im Jahr 2014 hieß es in dem Papier "Practical Lessons from Predicting Clicks on Ads at Facebook", dass die richtigen Merkmale das Wichtigste bei der Entwicklung von ML-Modellen sind. Seitdem haben viele der Unternehmen, mit denen ich zusammengearbeitet habe, immer wieder festgestellt, dass die richtigen Merkmale, sobald sie ein brauchbares Modell haben, im Vergleich zu cleveren algorithmischen Techniken wie dem Hyperparameter-Tuning den größten Leistungsschub bringen. Modernste Modellarchitekturen können immer noch schlecht abschneiden, wenn sie nicht die richtigen Merkmale verwenden.

Aufgrund ihrer Bedeutung besteht ein großer Teil vieler ML-Engineering- und Data-Science-Aufträge darin, neue nützliche Funktionen zu entwickeln. In diesem Kapitel gehen wir auf gängige Techniken und wichtige Überlegungen zum Feature Engineering ein. In einem eigenen Abschnitt gehen wir auf ein subtiles, aber verhängnisvolles Problem ein, das viele ML-Systeme in der Produktion zum Scheitern gebracht hat: Datenlecks und wie man sie erkennt und vermeidet.

Am Ende des Kapitels werden wir besprechen, wie man gute Merkmale entwickelt und dabei sowohl die Bedeutung als auch die Verallgemeinerung von Merkmalen berücksichtigt. Wenn man von Feature Engineering spricht, denken manche Leute vielleicht an Feature Stores. Da Feature Stores näher an ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9781098180331

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Maschinelle Lernsysteme entwerfen

by Chip Huyen

Kapitel 5. Feature Engineering

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.