book

Praxiseinstieg Large Language Models

Name: Praxiseinstieg Large Language Models
Author: Sinan Ozdemir
ISBN: 9783960092407

by Sinan Ozdemir

May 2024

Intermediate to advanced

274 pages

7h 29m

German

dpunkt

Read now

Unlock full access

Cover
Lob für »Praxiseinstieg Large Language Models«
Titel
Impressum
Inhalt
Vorwort
Einleitung
Teil I: Einführung in Large Language Models
1 Überblick über Large Language Models
Was sind Large Language Models?Definition von LLMsHauptmerkmale von LLMsWie LLMs funktionierenGängige moderne LLMsBERTGPT-3 und ChatGPTT5Domänenspezifische LLMsAnwendungen von LLMsKlassische NLP-AufgabenFreitexterzeugungInformationsabruf/neuronale semantische SucheChatbotsZusammenfassung
2 Semantische Suche mit LLMs
Die AufgabeAsymmetrische semantische SucheDie Lösung im ÜberblickDie KomponentenEngines für Text-EmbeddingsChunking von DokumentenVektordatenbankenPineconeOpen-Source-AlternativenNeueinstufen der abgerufenen ErgebnisseAPIAlles zusammenPerformanceDie Kosten von Closed-Source-KomponentenZusammenfassung

3 Erstes Prompt Engineering und ein Chatbot mit ChatGPT
Prompt EngineeringAusrichtung in SprachmodellenEinfach fragenFew-Shot-LearningStrukturierung der AusgabePersonas fordern aufMit Prompts modellübergreifend arbeitenChatGPTCohereOpen-Source-Prompt-EngineeringEinen Frage-Antwort-Bot mit ChatGPT aufbauenZusammenfassung
Teil II: Das Beste aus LLMs herausholen
4 LLMs mit individuellem Feintuning optimieren
Transfer Learning und Feintuning: die GrundlagenDer Feintuning-Prozess im DetailVortrainierte Closed-Source-Modelle als GrundlageDie OpenAI-API für das FeintuningDie GPT-3-API für das FeintuningFallstudie 1: Stimmungsklassifizierung von Amazon-RezensionenRichtlinien und bewährte Methoden für DatenIndividuelle Beispiele mit der OpenAI-CLI vorbereitenDie OpenAI-CLI einrichtenHyperparameter auswählen und optimierenUnser erstes feingetuntes LLMFeingetunte Modelle mit quantitativen Metriken bewertenQualitative BewertungstechnikenFeingetunte GPT-3-Modelle in Anwendungen integrierenFallstudie 2: Klassifizierung der Kategorien von Amazon-RezensionenZusammenfassung
5 Fortgeschrittenes Prompt Engineering
Prompt-Injection-AngriffeEingaben und Ausgaben validierenBeispiel: Validierungspipelines mit NLI aufbauenPrompts im Stapel verarbeitenPrompts verkettenVerkettung als Schutz gegen Prompt InjectionVerkettung, um Prompt Stuffing zu verhindernBeispiel: Sicherheit durch Verkettung multimodaler LLMsPrompting mit GedankenketteBeispiel: Grundlegende ArithmetikNoch einmal: Few-Shot-LearningBeispiel: Grundschularithmetik mit LLMsTesten und iterative Entwicklung von PromptsZusammenfassung
6 Embeddings und Modellarchitekturen anpassen
Fallstudie: Ein Empfehlungssystem aufbauenDas Problem und die Daten einrichtenDas Problem der Empfehlung definierenUnser Empfehlungssystem im ÜberblickEin benutzerdefiniertes Beschreibungsfeld generieren, um Artikel zu vergleichenMit Basis-Embeddern eine Baseline einrichtenDie Feintuning-Daten vorbereitenOpen-Source-Embedder mithilfe von Sentence Transformers feintunenZusammenfassung der ErgebnisseZusammenfassung
Teil III: Fortgeschrittene LLM-Nutzung
7 Jenseits der Basismodelle: LLMs kombinieren
Fallstudie: Visuelles Frage-Antwort-SystemEinführung in unsere Modelle: der Vision Transformer, GPT-2 und DistilBERTProjektion und Fusion verborgener ZuständeWas ist Cross-Attention, und warum ist sie entscheidend?Unser benutzerdefiniertes multimodales ModellUnsere Daten: Visual QADie VQA-TrainingsschleifeZusammenfassung der ErgebnisseFallstudie: Reinforcement Learning from FeedbackUnser Modell: FLAN-T5Unser Belohnungsmodell: Sentiment und grammatische KorrektheitDie Bibliothek Transformer Reinforcement LearningDie RLF-TrainingsschleifeZusammenfassung der ErgebnisseZusammenfassung
8 Feintuning fortgeschrittener Open-Source-LLMs
Beispiel: Multilabel-Klassifizierung mit BERT für Anime-GenresDie Performance für die Multilabel-Genre-Vorhersage von Anime-Titeln mit dem Jaccard-Koeffizienten messenEine einfache Feintuning-SchleifeAllgemeine Tipps zum Feintuning von Open-Source-LLMsZusammenfassung der ErgebnisseBeispiel: LaTeX-Generierung mit GPT-2Prompt Engineering für Open-Source-ModelleZusammenfassung der ErgebnisseSAWYER: Sinans Versuch, kluge und dennoch fesselnde Antworten zu gebenSchritt 1: Überwachtes Feintuning mit AnweisungenSchritt 2: Training des BelohnungsmodellsSchritt 3: Reinforcement Learning mit (geschätzter) menschlicher RückkopplungZusammenfassung der ErgebnisseDie sich ständig verändernde Welt des FeintuningsZusammenfassung
9 LLMs in die Produktion überführen
Closed-Source-LLMs in der Produktion bereitstellenKostenprognosenAPI-SchlüsselverwaltungOpen-Source-LLMs in der Produktion bereitstellenEin Modell für Inferenz vorbereitenInteroperabilitätQuantisierungBeschneidenWissensdestillationFallstudie: Unsere Anime-Genre-Vorhersage destillierenKostenprognosen mit LLMsDie Plattform Hugging FaceZusammenfassungIhre Beiträge sind wichtigWeitermachen!
Teil IV: Anhänge
Anhang A: LLM-FAQs
Anhang B: LLM-Glossar
Anhang C: Archetypen von LLM-Anwendungen
Fußnoten
Index
Über den Autor
Kolophon

Content preview from Praxiseinstieg Large Language Models

KAPITEL 7

Jenseits der Basismodelle: LLMs kombinieren

In den vorangegangenen Kapiteln haben wir uns darauf konzentriert, vortrainierte Modelle wie BERT zu verwenden oder feinzutunen, um eine Vielzahl von Aufgaben bei der Verarbeitung natürlicher Sprache und der Computervision anzugehen. Diese Modelle haben zwar bei einem breiten Spektrum von Benchmarks den neuesten Stand der Technik demonstriert, doch reichen sie möglicherweise nicht aus, um komplexere oder domänenspezifischere Aufgaben zu lösen, die ein tieferes Verständnis des Problems erfordern.

In diesem Kapitel untersuchen wir das Konzept, neue LLM-Architekturen zu konstruieren, indem man vorhandene Modelle kombiniert. Durch die Kombination verschiedener Modelle können wir von deren Stärken ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9781098169039Errata Page

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Praxiseinstieg Large Language Models

by Sinan Ozdemir

KAPITEL 7

Jenseits der Basismodelle: LLMs kombinieren

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.