book

Natural Language Processing mit PyTorch

by Delip Rao, Brian McMahan

November 2019

Intermediate to advanced

250 pages

6h 50m

German

dpunkt

Read now

Unlock full access

Cover
Titel
Impressum
Inhalt
Vorwort
1 Einführung
Das Paradigma des überwachten LernensBeobachtung und Zielcodierung1-aus-n-DarstellungTF-DarstellungTF-IDF-DarstellungZielcodierungBerechnungsgraphenGrundlagen von PyTorchPyTorch installierenTensoren erstellenTyp und Größe von TensorenTensor-OperationenIndizieren, Slicing und VerknüpfenTensoren und BerechnungsgraphenCUDA-TensorenÜbungenLösungenZusammenfassungLiteraturhinweise
2 Kurzer Abriss des traditionellen NLP
Korpora, Token und TypenMonogramme, Bigramme, Trigramme, …, N-GrammeLemmas und StämmeSätze und Dokumente kategorisierenWörter kategorisieren: POS-TaggingSpannen kategorisieren: Phrasenerkennung und EigennamenerkennungStruktur von SätzenWortbedeutungen und SemantikZusammenfassungLiteraturhinweise
3 Grundlegende Komponenten von neuronalen Netzen
Das Perzeptron: Das einfachste neuronale NetzAktivierungsfunktionenSigmoidTanhReLUSoftmaxVerlustfunktionenMittlere quadratische AbweichungKategorischer Kreuzentropie-VerlustBinärer Kreuzentropie-VerlustÜberwachtes Training unter der LupeDie Spielzeugdaten konstruierenGradientenbasiertes überwachtes LernenUnterstützende TrainingskonzepteModellperformance richtig messen: BewertungskennzahlenModellperformance richtig messen: das Dataset aufteilenFeststellen, wann das Training beendet werden sollteDie richtigen Hyperparameter findenRegularisierungBeispiel: Stimmungen von Restaurantbewertungen klassifizierenDas Yelp-Dataset für BewertungenDie Dataset-Darstellung von PyTorch verstehenVocabulary, Vectorizer und DataLoaderEin Perzeptron-KlassifiziererDie TrainingsroutineBewertung, Inferenz und InspektionZusammenfassungLiteraturhinweise
4 Feedforward-Netze für NLP
Das Multilayer-PerzeptronEin einfaches Beispiel: XORMLPs in PyTorch implementierenBeispiel: Nachnamen mit einem MLP klassifizierenDas Nachnamen-DatasetVocabulary, Vectorizer und DataLoaderDas SurnameClassifier-ModellDie TrainingsroutineModellauswertung und VorhersageMLPs regularisieren: Gewichtsregularisierung und strukturelle Regularisierung (oder Dropout)CNNsCNN-HyperparameterCNNs in PyTorch implementierenBeispiel: Nachnamen mit einem CNN klassifizierenDie Klasse SurnameDatasetVocabulary, Vectorizer und DataLoaderDen SurnameClassifier mit CNNs neu implementierenDie TrainingsroutineModellbewertung und VorhersageVerschiedene Themen in CNNsPoolingBatch-Normalisierung (BatchNorm)Netzwerk-in-Netzwerk-Verbindungen (1x1-Faltungen)Residual-Verbindungen/Residual-BlockZusammenfassungLiteraturhinweise
5 Wörter und Typen einbetten
Warum Einbettungen lernen?Effizienz von EinbettungenAnsätze für das Lernen von WorteinbettungenDie praktische Verwendung von vortrainierten WorteinbettungenBeispiel: Erlernen der CBOW-EinbettungenDas Frankenstein-DatasetVocabulary, Vectorizer und DataLoaderDas CBOWClassifier-ModellDie TrainingsroutineModellbewertung und VorhersageBeispiel: Transfer-Lernen mit vortrainierten Einbettungen für DokumentklassifizierungDas Dataset AG NewsVocabulary, Vectorizer und DataLoaderDas NewsClassifier-ModellDie TrainingsroutineModellbewertung und VorhersageZusammenfassungLiteraturhinweise

6 Sequenzmodellierung für NLP
Einführung in rekurrente neuronale NetzeEin Elman-Netz implementierenBeispiel: Die Nationalität von Nachnamen mit einem Zeichen-RNN klassifizierenDie Klasse SurnameDatasetDie Datenstrukturen der VektorisierungDas SurnameClassifier-ModellDie Trainingsroutine und die ErgebnisseZusammenfassungLiteraturhinweise
7 Intermediäre Sequenzmodellierung für NLP
Das Problem mit einfachen RNNs (oder Elman-Netzen)Gating als eine Lösung für Herausforderungen von einfachen RNNsBeispiel: Nachnamen mit Zeichen-RNN generierenDie Klasse SurnameDatasetDie Vektorisierungs-DatenstrukturenVom ElmanRNN zur GRUModell 1: Das unkonditionierte SurnameGenerationModelModell 2: Das konditionierte SurnameGenerationModelDie Trainingsroutine und die ErgebnisseTipps und Tricks für das Training von SequenzmodellenLiteraturhinweise
8 Erweiterte Sequenzmodellierung für NLP
Sequenz-zu-Sequenz-Modelle, Encoder-Decoder-Modelle und konditionierte GenerierungMehr von einer Sequenz erfassen: Bidirektionale rekurrente ModelleMehr von einer Sequenz erfassen: AttentionAttention in tiefen neuronalen NetzenSequenzgenerierungsmodelle bewertenBeispiel: Neuronale maschinelle ÜbersetzungDas Dataset für maschinelle ÜbersetzungEine Vektorisierungs-Pipeline für NMTIm NMT-Modell codieren und decodierenDie Trainingsroutine und die ErgebnisseZusammenfassungLiteraturhinweise
9 Klassiker, Grenzen und nächste Schritte
Was haben Sie bisher gelernt?Zeitlose Themen in NLPDialog- und interaktive SystemeDiskursInformationsextraktion und Text MiningAnalyse und Abrufen von DokumentenGrenzen in NLPEntwurfsmuster für NLP-ProduktionssystemeWie geht es weiter?Literaturhinweise
Index
Über die Autoren

Overview

Sprachanwendungen wie Amazon Alexa und Google Translate sind heute allgegenwärtig. Grundlage dafür ist das Natural Language Processing (NLP), das zahllose Möglichkeiten für die Entwicklung intelligenter, Deep-Learning-basierter Anwendungen eröffnet. In diesem Buch lernen Sie die neuesten Techniken zur Verarbeitung von Sprache kennen und nutzen dabei das neue, flexible Deep-Learning-Framework PyTorch.

Die Autoren vermitteln Ihnen einen Überblick über NLP-Methoden und Grundkonzepte neuronaler Netze und demonstrieren Ihnen dann, wie Sie Sprachanwendungen mit PyTorch entwickeln. Sie erfahren z.B., wie Sie Einbettungen verwenden, um Wörter, Sätze und Dokumente darzustellen, wie sich Sequenzdaten mit RNNs modellieren und Sequenzvoraussagen und Sequenz-zu-Sequenz-Modelle generieren lassen, und Sie lernen Entwurfsmuster für den Aufbau von produktionsreifen NLP-Systemen kennen.

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Natural Language Processing mit Transformern

Publisher Resources

ISBN: 9781098123772

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills