book

Praxisbuch Large Language Models

Name: Praxisbuch Large Language Models
Author: Jay Alammar; Maarten Grootendorst
ISBN: 9783960092667

by Jay Alammar; Maarten Grootendorst

October 2025

Intermediate to advanced

434 pages

12h 13m

German

Rheinwerk Verlag GmbH

Read now

Unlock full access

Cover
Hinweise zur Benutzung
Stimmen zu: Praxisbuch Large Language Models
Titel
Impressum
Inhalt
Vorwort
Teil I: Die Funktionsweise von Sprachmodellen verstehen
1 Einführung in Large Language Models
Was ist Language AI?Die jüngsten Entwicklungen im Bereich der Language AIDarstellung von Sprache als ein Bag-of-WordsVerbesserte Vektordarstellungen mit Dense Vector EmbeddingsArten von EmbeddingsKontext mit Attention codieren und decodierenAttention Is All You NeedRepresentation-Modelle – rein Encoder-basierte Modelle (»Encoder-only«)Generative Modelle – rein Decoder-basierte Modelle (»Decoder-only«)Das Jahr der generativen KIDie sich wandelnde Definition von Large Language ModelsWie sich das Training von Large Language Models im Vergleich zu traditionellen Ansätzen unterscheidetAnwendungsmöglichkeiten und Nutzen von Large Language ModelsLLMs verantwortungsvoll entwickeln und nutzenLimited Resources Are All You Need – LLMs auch ohne große Rechenressourcen trainieren und verwendenSchnittstellen zur Nutzung von LLMsProprietäre, nicht frei zugängliche ModelleFrei zugängliche ModelleOpen-Source-FrameworksIhren ersten Text mit einem LLM generierenZusammenfassung
2 Tokns und Embeddings
Tokenisierung bei LLMsWie Tokenizer die Eingaben für das Sprachmodell aufbereitenLLMs herunterladen und ausführenWelche Faktoren sind bei der Tokenisierung entscheidend?Tokenisierung auf Wort-, Wortteil-, Zeichen- und Byte-EbeneEin Vergleich verschiedener trainierter TokenizerFaktoren, die darüber entscheiden, wie sich ein Tokenizer verhältToken-EmbeddingsSprachmodelle halten Embeddings für das Vokabular ihres Tokenizers vorKontextualisierte Word-Embeddings mit Sprachmodellen erstellenText-Embeddings (für Sätze oder ganze Dokumente)Wie Word-Embeddings jenseits von LLMs genutzt werden könnenVortrainierte Word-Embeddings nutzenDer Word2vec-Algorithmus und Training mittels Contrastive LearningEmpfehlungssysteme aufbauen, die auf Embeddings basierenSongs mithilfe von Embeddings empfehlenEmbedding-Modelle zur Empfehlung von Songs trainierenZusammenfassung

3 Ein Blick ins Innere von Large Language Models
Ein erster Überblick über Transformer-ModelleDie Ein- und Ausgaben eines Transformer-basierten LLMDie einzelnen Komponenten, die beim Forward-Pass durchlaufen werdenAuswahl eines einzelnen Tokens anhand einer Wahrscheinlichkeitsverteilung (Sampling/Decodierung)Parallele Verarbeitung von Tokens und KontextlängeSchnellere Generierung durch Zwischenspeichern von Schlüsseln und WertenEin Blick ins Innere des Transformer-BlocksVerbesserungen an der Transformer-ArchitekturEffizienterer Attention-MechanismusDer Transformer-BlockPositional-Embeddings (RoPE)Weitere Vorschläge und Verbesserungen im Hinblick auf die ArchitekturZusammenfassung
Teil II: Vortrainierte Sprachmodelle verwenden
4 Textklassifikation
Sentimentanalyse von SpielfilmrezensionenTexte mit Representation-Modellen klassifizierenEin geeignetes Modell auswählenEin aufgabenspezifisches Modell verwendenTexte mit Embedding-Modellen klassifizierenÜberwachte KlassifikationWas aber, wenn Ihnen keine gelabelten Daten zur Verfügung stehen?Texte mit generativen Modellen klassifizierenTexte mit T5-(Text-to-Text-Transfer-Transformer-)Modellen klassifizierenTexte mit ChatGPT klassifizierenZusammenfassung
5 Clustering von Texten und Topic Modeling
ArXiv-Artikel aus dem Forschungsbereich Computation and LanguageDie bewährte Pipeline beim Text-ClusteringDokumente in Embeddings umwandelnDie Dimensionierung der Embeddings verringernDie dimensionsreduzierten Embeddings zu Clustern zusammenfassenDie gebildeten Cluster inspizierenVom Clustern von Texten hin zum Topic ModelingBERTopic: ein modulares Topic-Modeling-FrameworkDer modulare Aufbau des BERTopic-FrameworksEinen besonderen Baustein hinzufügenEin zusätzlicher Baustein zur TextgenerierungZusammenfassung
6 Prompt Engineering
Textgenerierungsmodelle verwendenEin geeignetes Textgenerierungsmodell wählenTextgenerierungsmodelle ladenEinfluss auf die Ausgabe eines Modells nehmenEinführung in das Prompt EngineeringDie grundlegenden Elemente eines PromptsPrompts formulieren, die Anweisungen enthalten (Instruction-based Prompting)Fortgeschrittene Prompt-Engineering-TechnikenPrompts komplexer gestaltenIn-Context Learning – Beispiele bereitstellenPrompt Chaining – Aufgaben in mehrere Teilaspekte aufteilenLogisches Schließen mit generativen Modellen (Reasoning)Chain-of-Thought – erst nachdenken, dann antwortenSelf-Consistency – Auswahl aus mehreren AntwortmöglichkeitenTree-of-Thought – über Zwischenschritte zur besten Antwort gelangenModellausgaben validierenBeispiele bereitstellenVorgaben machen und Modellausgaben beschränkenZusammenfassung
7 Fortgeschrittene Techniken und Tools im Bereich der Textgenerierung
Optimierungen hinsichtlich der Verwendung von Modellen – quantisierte Modelle mit dem LangChain-Framework ladenChains – die Anwendungsmöglichkeiten von LLMs noch erweiternPrompt-Templates mit einem LLM verkettenMehrere Prompts miteinander verkettenEinen Speicher bereitstellen – LLMs ermöglichen, sich an Gespräche zu erinnernConversation Buffer – LLMs den gesamten Gesprächsverlauf bereitstellenWindowed Conversation Buffer – LLMs einen Teil des Gesprächsverlaufs bereitstellenConversation Summary – LLMs eine Zusammenfassung des Gesprächsverlaufs bereitstellenAgenten – ein aus mehreren LLMs bestehendes System entwickelnDie treibende Kraft hinter Agenten – Schritt-für-Schritt-ReasoningReAct im LangChain-Framework verwendenZusammenfassung
8 Semantische Suche und Retrieval-Augmented Generation
Einführung in semantische Such- und RAG-SystemeSemantische Suche auf Basis von LLMsDense-Retrieval-SystemeReranking-SystemeMetriken zur Evaluierung von Retrieval-SystemenRetrieval-Augmented Generation (RAG)Suchsysteme zu RAG-Systemen erweiternEin Beispiel für eine auf Fakten basierende Generierung (Grounded Generation) mit einem gemanagten LLMEin Beispiel für ein RAG-System, bei dem das Modell lokal betrieben wirdFortgeschrittene Techniken im Bereich der RAG-SystemeRAG-Systeme evaluierenZusammenfassung
9 Multimodale Large Language Models
Vision TransformerMultimodale Embedding-ModelleCLIP – Modelle, die eine Verbindung zwischen Texten und Bildern herstellen könnenWie werden bei CLIP multimodale Embeddings generiert?OpenCLIPCLIP mit der sentence-transformers-Bibliothek ladenMultimodale Textgenerierungsmodelle erstellenBLIP-2 – Modelle erstellen, die auf Basis von Texten und Bildern logische Schlüsse ziehen könnenMultimodale Eingabedaten aufbereiten1. Anwendungsfall: Bildbeschriftungen erstellen2. Anwendungsfall: Chatmodelle erstellen, die multimodale Prompts unterstützenZusammenfassung
Teil III: Sprachmodelle trainieren und feintunen
10 Text-Embedding-Modelle erstellen
Embedding-ModelleWas genau ist Contrastive Learning?SBERTEmbedding-Modelle erstellenKontrastive Beispiele erstellenDas Modell trainierenDifferenziertere EvaluierungVerlustfunktionenEmbedding-Modelle feintunenEmbedding-Modelle mit gelabelten Datensätzen feintunenAugmented SBERTEmbedding-Modelle mit ungelabelten Daten feintunenTransformer-based Sequential Denoising Auto-Encoder (TSDAE)TSDAE zur Domain Adaptation nutzenZusammenfassung
11 Representation-Modelle für die Klassifikation feintunen
Klassifikation mit gelabelten DatenEin vortrainiertes BERT-Modell feintunenSchichten eines Modells einfrierenFew-Shot-KlassifikationSetFit – Modelle mit nur wenigen Trainingsbeispielen auf effiziente Weise feintunenModelle für die Few-Shot-Klassifikation feintunenBereits vortrainierte Modelle mittels Masked Language Modeling weiter vortrainierenNamed-Entity RecognitionDaten für die Named-Entity Recognition aufbereitenModelle für die Named-Entity Recognition feintunenZusammenfassung
12 Generative Modelle feintunen
Die drei Schritte beim Training von LLMs – Pretraining, Supervised Fine-Tuning und Preference TuningSupervised Fine-Tuning (SFT)Vollständiges Feintuning (Full Fine-Tuning)Parameter-efficient Fine-Tuning (PEFT)Instruction Tuning mit dem QLoRA-VerfahrenInstruktionsdaten über ein Template bereitstellenModelle quantisierenDie Konfiguration für das LoRA-Verfahren festlegenDie Parameter für das Training festlegenDas Modell trainierenGewichte des QLoRa-Modells mit denen des Basismodells zusammenführenGenerative Modelle evaluierenMetriken auf WortebeneBenchmarksLeaderboardsAutomatisierte EvaluierungEvaluierung durch MenschenModelle darauf ausrichten, was Nutzer erwarten – Preference Tuning, Alignment und Reinforcement Learning from Human FeedbackDie Preference Evaluation mithilfe von Reward-Modellen automatisierenDie Ein- und Ausgaben des Reward-ModellsEin Reward-Modell trainierenPreference Tuning ohne zusätzliches Training eines Reward-ModellsPreference Tuning mittels DPOTemplates für Präferenzdatensätze erstellenDas Modell quantisierenParameter für das Training festlegenDas Modell trainierenZusammenfassung
Schlussbemerkung
Fußnoten
Index

Content preview from Praxisbuch Large Language Models

Teil I Die Funktionsweise von Sprachmodellen verstehen

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Large Language Models selbst programmieren

Publisher Resources

ISBN: 9783960092667Publisher Website

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Praxisbuch Large Language Models

by Jay Alammar; Maarten Grootendorst

Teil I Die Funktionsweise von Sprachmodellen verstehen

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.