June 2025
Intermediate to advanced
414 pages
9h 54m
German
A
Abfragen 97
Adam 188
AdamW 188
Aktivierungsfunktionen
Feedforward 138
gaußsche 138
GELU 138
nichtlineare 323
ReLU 138
Schichtnormalisierung 131
SwiGLU 138
allowed_max_length 270
AlpacaEval 289
Antworten
extrahieren 286
speichern 286
Anweisungen
Datensatz 253
Feintuning 281
Anweisungsoptimierung 214, 393
Einführung 254
überwachte 254
Anwendungen, LLMs 22
APIs, LLMs 292
Apple Silicon 274
Apple, PyTorch 341
Architekturen
ausgeben 231
GPT- 127
Platzhalter- 127
assign 209
Attention
Bahdanau- 79
kausale 102
kausale Maske 103
maskierte 102
SelfAttention 109
Attention-Mechanismen 75
Attention-Scores (Aufmerksamkeitswerte)
Read now
Unlock full access