book

Deep Learning für Programmierer mit fastai und PyTorch

Name: Deep Learning für Programmierer mit fastai und PyTorch
ISBN: 9781098192211

by Jeremy Howard, Sylvain Gugger

September 2024

Intermediate to advanced

624 pages

18h 22m

German

O'Reilly Media, Inc.

Read now

Unlock full access

Vorwort
Für wen dieses Buch istWas du wissen musstWas du lernen wirstO'Reilly Online LearningWie du uns kontaktierst
Vorwort
I. Deep Learning in der Praxis
1. Deine Deep Learning-Reise
Deep Learning ist für alle daNeuronale Netze: Eine kurze GeschichteWer wir sindWie man Deep Learning lerntDeine Projekte und dein MindsetDie Software: PyTorch, fastai und Jupyter (und warum das keine Rolle spielt)Dein erstes ModellEinen GPU Deep Learning Server bekommenDein erstes Notebook betreibenWas ist maschinelles Lernen?Was ist ein neuronales Netz?Ein bisschen Deep Learning-JargonGrenzen des maschinellen LernensWie unser Bilderkenner funktioniertWas unser Bilderkenner gelernt hatBilderkennungssysteme können auch Aufgaben übernehmen, die nichts mit Bildern zu tun habenJargon RekapitulationDeep Learning ist nicht nur für die Bildklassifizierung geeignetValidierungssets und TestsetsErmessensspielraum bei der Festlegung von TestgruppenEin "Choose Your Own Adventure"-MomentFragebogenWeitere Forschung
2. Vom Modell zur Produktion
Die Praxis des Deep LearningDein Projekt startenDer Stand des Deep LearningDer Ansatz des AntriebsstrangsDas Sammeln von DatenVon Daten zu DataLoadersDatenerweiterungTrainiere dein Modell und benutze es, um deine Daten zu bereinigenVerwandle dein Modell in eine Online-BewerbungVerwendung des Modells für SchlussfolgerungenErstellen einer Notebook-App aus dem ModellDein Notebook in eine echte App verwandelnDeine App bereitstellenWie du eine Katastrophe vermeidestUnvorhergesehene Folgen und RückkopplungsschleifenSchreib los!FragebogenWeitere Forschung
3. Daten-Ethik
Wichtige Beispiele für DatenethikBugs und Regress: Fehlerhafter Algorithmus für Gesundheitsleistungen genutztFeedback-Schleifen: Das Empfehlungssystem von YouTubeVorurteil: Professorin Latanya Sweeney "verhaftet"Warum ist das so wichtig?Maschinelles Lernen in das Produktdesign integrierenThemen der DatenethikRückgriff und RechenschaftspflichtRückkopplungsschleifenBiasDesinformationEthische Probleme erkennen und angehenAnalysiere ein Projekt, an dem du gerade arbeitestZu implementierende ProzesseDie Kraft der VielfaltFairness, Rechenschaftspflicht und TransparenzDie Rolle der PolitikDie Effektivität der RegulierungRechte und PolitikAutos: Ein historischer PräzedenzfallFazitFragebogenWeitere ForschungDeep Learning in der Praxis: Das war's!
II. Die Anwendungen von fastai verstehen
4. Unter der Haube: Training eines Ziffernklassifikators
Pixels: Die Grundlagen der Computer VisionErster Versuch: Pixel-ÄhnlichkeitNumPy Arrays und PyTorch TensorenBerechnung von Metriken mithilfe von BroadcastingStochastischer GradientenabstiegBerechnen von GradientenTreten mit einer LernrateEin End-to-End SGD-BeispielZusammenfassender GradientenabstiegDie MNIST-VerlustfunktionSigmoidSGD und Mini-BatchesAlles zusammenfügenEinen Optimierer erstellenHinzufügen einer NichtlinearitätTiefer gehenJargon RekapitulationFragebogenWeitere Forschung
5. Bildklassifizierung
Von Hunden und Katzen zu HaustierrassenVoreinstellungÜberprüfen und Debuggen eines DataBlocksQuer-Entropie-VerlustAnzeigen von Aktivierungen und LabelsSoftmaxLog LikelihoodEinnahme des ProtokollsModell InterpretationUnser Modell verbessernDer Lernraten-FinderUnfreezing und TransferlernenDiskriminierende LernratenAuswählen der Anzahl der EpochenTiefergehende ArchitekturenFazitFragebogenWeitere Forschung
6. Andere Computer Vision Probleme
Multi-Label-KlassifizierungDie DatenEinen DataBlock konstruierenBinäre KreuzentropieRegressionZusammenstellen der DatenEin Modell trainierenFazitFragebogenWeitere Forschung

7. Ausbildung eines State-of-the-Art-Modells
ImagenetteNormalisierungProgressive GrößenanpassungTestzeitverlängerungVerwechslungEtikett glättenFazitFragebogenWeitere Forschung
8. Vertiefung der kollaborativen Filterung
Ein erster Blick auf die DatenLernen der latenten FaktorenErstellen der DataLoaderKollaboratives Filtern von Grund aufGewicht VerfallUnser eigenes Einbettungsmodul erstellenEinbettungen und Verzerrungen interpretierenFastai.collab verwendenEinbettung AbstandBootstrapping eines kollaborativen FiltermodellsDeep Learning für kollaboratives FilternFazitFragebogenWeitere Forschung
9. Tabellarische Modellierung - Deep Dive
Kategoriale EinbettungenJenseits von Deep LearningDer DatensatzKaggle WettbewerbeSchau dir die Daten anEntscheidungsbäumeUmgang mit DatenTabularPandas und TabularProc verwendenErstellen des EntscheidungsbaumsKategoriale VariablenZufallsforstenErstellen eines Random ForestOut-of-Bag-FehlerModell InterpretationBaumvarianz für VorhersagezuverlässigkeitMerkmal WichtigkeitEntfernen von Variablen mit geringer WichtigkeitRedundante Merkmale entfernenPartielle AbhängigkeitDatenleckageBaum-DolmetscherExtrapolation und neuronale NetzeDas Problem der ExtrapolationFinden von Daten außerhalb der DomäneEin neuronales Netzwerk verwendenZusammenstellungAnkurbelungKombination von Einbettungen mit anderen MethodenFazitFragebogenWeitere Forschung
10. NLP-Tiefgang: RNNs
TextvorverarbeitungTokenisierungWort-Tokenisierung mit fastaiTokenisierung von UnterwörternNumerisierung mit fastaiUnsere Texte in Stapel für ein Sprachmodell einteilenEinen Textklassifikator trainierenSprachmodell mit DataBlockFeinabstimmung des SprachmodellsSpeichern und Laden von ModellenTextgenerierungErstellen der Klassifikator-DataLoaderFeinabstimmung des KlassifikatorsDesinformation und SprachmodelleFazitFragebogenWeitere Forschung
11. Data Munging mit der fastai Mid-Level API
Tieferer Einblick in die fastai-API (Layered API)TransformiertSchreibe deine eigene TransformationPipelineTfmdListen und Datensätze: Transformierte SammlungenTfmdListsDatensätzeDie Anwendung der Mid-Level Data API: SiamesischesPaarFazitFragebogenWeitere ForschungDie Anwendungen von fastai verstehen: Nachbereitung
III. Grundlagen des Deep Learning
12. Ein Sprachmodell von Grund auf
Die DatenUnser erstes Sprachmodell von Grund aufUnser Sprachmodell in PyTorchUnser erstes rekurrentes neuronales NetzVerbesserung des RNNAufrechterhaltung des Zustands eines RNNMehr Signal schaffenMehrschichtige RNNsDas ModellExplodierende oder verschwindende AktivierungenLSTMEinen LSTM von Grund auf neu bauenTraining eines Sprachmodells mit LSTMsRegularisierung eines LSTMAusstiegAktivierungsregulierung und temporale AktivierungsregulierungTraining eines gewichteten regulierten LSTMFazitFragebogenWeitere Forschung
13. Faltungsneuronale Netze
Die Magie der KonvoluteEinen Faltungs-Kernel abbildenFaltungen in PyTorchSchrittlänge und PolsterungDie Faltungsgleichungen verstehenUnser erstes Faltungsneuronales NetzDas CNN erstellenDie Faltungsarithmetik verstehenEmpfängliche FelderEin Hinweis zu TwitterFarbbilderVerbesserung der AusbildungsstabilitätEine einfache BasislinieChargengröße erhöhen1cycle TrainingBatch-NormalisierungFazitFragebogenWeitere Forschung
14. ResNets
Zurück zu ImagenetteAufbau eines modernen CNN: ResNetVerbindungen überspringenEin hochmodernes ResNetEngpass-SchichtenFazitFragebogenWeitere Forschung
15. Anwendungsarchitekturen Deep Dive
Computer Visioncnn_Learnerunet_learningEin siamesisches NetzwerkNatürliche SprachverarbeitungTabellarischFazitFragebogenWeitere Forschung
16. Der Ausbildungsprozess
Festlegung einer BasislinieEin generischer OptimiererMomentumRMSPropAdamEntkoppelte GewichtsabnahmeRückrufeEinen Rückruf erstellenRückrufreihenfolge und AusnahmenFazitFragebogenWeitere ForschungGrundlagen des Deep Learning: Nachbereitung
IV. Deep Learning von Grund auf
17. Ein neuronales Netz von Grund auf
Neuronale Netze von Grund auf neu aufbauenModellierung eines NeuronsMatrix Multiplikation von Grund aufElementare ArithmetikSendungEinstein SummationDie Vorwärts- und RückwärtspässeDefinieren und Initialisieren einer EbeneSteigungen und der RückwärtspassRefactoring des ModellsAuf dem Weg zu PyTorchFazitFragebogenWeitere Forschung
18. CNN-Dolmetschen mit CAM
CAM und HakenGradient CAMFazitFragebogenWeitere Forschung
19. Ein fastai Lerner von Grund auf
DatenDatensatzModul und ParameterEinfaches CNNVerlustLernendeRückrufeZeitplanungsprogramm für die LernrateFazitFragebogenWeitere Forschung
20. Abschließender Gedanke
A. Einen Blog erstellen
Bloggen mit GitHub PagesDas Repository erstellenEinrichten deiner HomepageBeiträge erstellenGitHub und deinen Computer synchronisierenJupyter zum Bloggen
B. Checkliste für Datenprojekte
DatenwissenschaftlerInnenStrategieDatenAnalytikUmsetzungWartungZwänge
Index

Content preview from Deep Learning für Programmierer mit fastai und PyTorch

Kapitel 14. ResNets

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel bauen wir auf den im vorherigen Kapitel vorgestellten CNNs auf und erklären dir die ResNet (Residual Network) Architektur. Sie wurde 2015 von Kaiming He et al. in dem Artikel "Deep Residual Learning for Image Recognition" vorgestellt und ist heute die mit Abstand am häufigsten verwendete Modellarchitektur. Neuere Entwicklungen im Bereich der Bilderkennung verwenden fast immer denselben Trick der Residualverbindungen und sind meist nur eine Weiterentwicklung des ursprünglichen ResNet.

Wir zeigen dir zunächst das grundlegende ResNet, wie es ursprünglich entwickelt wurde, und erklären dann die modernen Verbesserungen, die es leistungsfähiger machen. Doch zunächst brauchen wir ein Problem, das etwas schwieriger ist als der MNIST-Datensatz, da wir mit einem normalen CNN bereits eine Genauigkeit von fast 100 % erreichen.

Zurück zu Imagenette

Es wird schwierig sein, Verbesserungen an unseren Modellen zu beurteilen, wenn wir bereits eine so hohe Genauigkeit wie bei MNIST im vorigen Kapitel erreicht haben, also nehmen wir ein schwierigeres Bildklassifizierungsproblem in Angriff, indem wir zu Imagenette zurückkehren. Wir bleiben bei kleinen Bildern, damit es einigermaßen schnell geht.

Nehmen wir die Daten - wir verwenden die bereits verkleinerte Version mit 160 Pixeln, damit es noch schneller geht, und beschneiden sie ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Machine Learning visuell lernen - von StatQuest - Mit Bildern ganz einfach lernen und verstehen

Publisher Resources

ISBN: 9781098192211

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Deep Learning für Programmierer mit fastai und PyTorch

by Jeremy Howard, Sylvain Gugger

Kapitel 14. ResNets

Zurück zu Imagenette

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.