book

Ingénierie rapide pour l'IA générative

by James Phoenix, Mike Taylor

November 2024

Intermediate to advanced

422 pages

11h 32m

French

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Exigences logicielles pour ce livreConventions utilisées dans ce livreUtiliser des exemples de codeApprentissage en ligne O'ReillyComment nous contacterRemerciements
Vue d'ensemble des cinq principes du prompt.1. Donne des directives2. Spécifier le format3. Donne des exemples4. Évaluer la qualité5. Diviser le travailRésumé
Qu'est-ce qu'un modèle de génération de texte ?Représentations vectorielles : L'essence numérique du langageArchitecture transformatrice : Orchestrer les relations contextuellesGénération de textes probabilistes : Le mécanisme de décisionFondements historiques : L'essor des architectures de transformateursTransformateurs génératifs pré-entraînés d'OpenAIGPT-3.5-turbo et ChatGPTGPT-4Gemini de GoogleLe lama de Meta et l'Open SourceTirer parti de la quantification et de la LoRAMistralAnthropique : ClaudeGPT-4V(ision)Comparaison des modèlesRésumé
Générer des listesGénération de listes hiérarchiquesQuand éviter d'utiliser des expressions régulièresGénérer JSONYAMLFiltrer les charges utiles YAMLGestion des charges utiles non valides en YAMLGénération de formats divers avec ChatGPTDonnées CSV fictivesExplique-moi comme si j'avais cinq ansLa traduction universelle grâce aux LLMsDemande le contexteStyle de texte non groupéIdentifier les caractéristiques textuelles souhaitéesGénérer un nouveau contenu avec les caractéristiques extraitesExtraction de caractéristiques textuelles spécifiques avec les LLMs.RésuméRésumer un contexte donné Limites de la fenêtreDécoupage du texteAvantages de la fragmentation du texteScénarios de découpage du texteMauvais exemple de découpageStratégies de regroupementDétection de phrases à l'aide de SpaCyConstruis un algorithme simple de découpage en morceaux en Python.Chunking des fenêtres coulissantesPaquets de regroupement de textesLe découpage de texte avec TiktokenEncodagesComprendre la tokenisation des chaînes de caractèresEstimation de l'utilisation des jetons pour les appels à l'API de chatAnalyse des sentimentsTechniques pour améliorer l'analyse des sentimentsLimites et défis de l'analyse des sentimentsDu moins au plusPlanifier l'architectureCodage des fonctions individuellesAjouter des testsAvantages de la technique du moins au plusDéfis avec la technique du moins au plusPrompt à jouer un rôleAvantages des prompteurs de rôleLes défis de l'incitation à jouer un rôleQuand utiliser les messages-guides sur les rôles ?Tactiques d'incitation GPTÉviter les hallucinations avec la référenceAccorde aux TPG un "temps de réflexion"La tactique du monologue intérieurRéponses à l'auto-évaluation LLMClassification avec les LLMsConstruire un modèle de classificationVote majoritaire pour la classificationCritères d'évaluationMeta Prompting (en anglais)Résumé
Introduction à LangChainConfiguration de l'environnementModèles de chatModèles de chat en continuCréer plusieurs générations de LLMLangChain Modèles de promptsLangChain Expression Language (LCEL)Utilisation de PromptTemplate avec des modèles de chatParseurs de sortieÉvaluations de LangChainAppel de fonction OpenAIAppel de fonction parallèleAppel de fonction dans LangChainExtraire des données avec LangChainPlanification des requêtesCréation de modèles de prompts de quelques instantsExemples de quelques coups de feu à longueur fixeFormatage des exemplesSélection d'exemples de peu de plans en fonction de leur longueurLimites avec quelques exemplesSauvegarde et chargement des prompts LLMConnexion des donnéesChargeurs de documentsSéparateurs de texteFractionnement du texte en fonction de la longueur et de la taille des jetonsFractionnement de texte avec fractionnement récursif des caractèresDécomposition des tâchesChaînage promptChaîne séquentielleitemgetter et extraction de clé de dictionnaireStructurer les chaînes LCELChaînes de documentsTrucs et astucesRaffinerMap ReduceRe-classement des cartesRésumé
Génération Augmentée de Récupération (GAR)Présentation des emboîtementsChargement des documentsRécupération de la mémoire avec FAISSRAG avec LangChainBases de données vectorielles hébergées avec PineconeAuto-questionnementAutres mécanismes de récupérationRésumé
Chaîne de penséeAgentsRaisonner et agir (React)Raison et mise en œuvre de l'acteUtiliser des outilsUtiliser les LLMs comme une API (Fonctions OpenAI)Comparaison des fonctions d'OpenAI et de ReactCas d'utilisation des fonctions OpenAIReactCas d'utilisation de ReactBoîte à outils pour les agentsPersonnalisation des agents standardAgents en douane à LCELComprendre et utiliser la mémoireMémoire à long termeMémoire à court termeMémoire à court terme chez les agents de conversation de l'AQMémoire dans LangChainPréserver l'ÉtatInterroger l'ÉtatMémoire tampon de conversationAutres types de mémoire populaires dans LangChainMémoire de la fenêtre de conversationMémoire de résumé de conversationMémoire tampon du résumé de conversationMémoire tampon ConversationTokenFonctions OpenAI Agent avec mémoireCadres d'agents avancésAgents de planification et d'exécutionL'arbre des penséesRappelsRappels globaux (constructeurs)Rappels spécifiques aux demandesL'argument verbeuxQuand utiliser Which ?Comptage de jetons avec LangChainRésumé
OpenAI DALL-EVoyage à mi-parcoursDiffusion stableGoogle GeminiDu texte à la vidéoComparaison des modèlesRésumé
Modificateurs de formatModificateurs de style artistiqueInvitations à la rétro-ingénierieBoosters de qualitéLes prompts négatifsTermes pondérésLes prompts à l'aide d'une imagePeinturePeinture sur toileCaractères cohérentsRéécriture d'un promptMeme UnbundlingCartographie des mèmesAnalyse des promptsRésumé
Exécution de la diffusion stableInterface utilisateur Web de l'AUTOMATIC1111Img2ImgMise à l'échelle des imagesInterroger CLIPSD Inpainting et OutpaintingControlNetModèle de segment de quelque chose (SAM)Mise au point de DreamBoothAffineur XL à diffusion stableRésumé

Rédaction d'un blog sur l'IARecherche sur les sujetsInterview d'un expertGénérer un planGénération de texteStyle d'écritureOptimisation du titreImages du blog AIInterface utilisateurRésumé

Content preview from Ingénierie rapide pour l'IA générative

Chapitre 5. Bases de données vectorielles avec FAISS et Pinecone

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Ce chapitre présente le concept des embeddings et des bases de données vectorielles, en discutant de la façon dont ils peuvent être utilisés pour fournir un contexte pertinent dans les prompts.

Une base de données vectorielle est un outil le plus souvent utilisé pour stocker des données textuelles de manière à pouvoir les interroger sur la base de leur similarité ou de leur signification sémantique. Cette technologie est utilisée pour diminuer les hallucinations (lorsque le modèle d'IA invente quelque chose) en référençant des données sur lesquelles le modèle n'est pas entraîné, ce qui améliore considérablement la précision et la qualité de la réponse du LLM. Les cas d'utilisation des bases de données vectorielles comprennent également la lecture de documents, la recommandation de produits similaires ou la mémorisation de conversations passées.

Lesvecteurs sont des listes de nombres représentant du texte (ou des images), que tu peux assimiler aux coordonnées d'un lieu. Le vecteur pour le mot souris en utilisant le modèle text-embedding-ada-002 d'OpenAI est une liste de 1 536 nombres, chacun représentant la valeur d'une caractéristique que le modèle d'intégration a apprise au cours de l'entraînement :

[-0.011904156766831875,
 -0.0323905423283577,
 0.001950666424818337,
...]

Lorsque ces modèles ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341615281Supplemental Content

Ingénierie rapide pour l'IA générative

by James Phoenix, Mike Taylor

Chapitre 5. Bases de données vectorielles avec FAISS et Pinecone

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

L'IA explicable pour les praticiens

Mise en œuvre des MLOps dans l'entreprise

Lotus Instant Messaging/Web Conferencing (Sametime): Building Sametime Enabled Applications

Human-Centered Metaverse

Publisher Resources

Chapitre 5. Bases de données vectorielles avec FAISS et Pinecone

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

L'IA explicable pour les praticiens

Mise en œuvre des MLOps dans l'entreprise

Lotus Instant Messaging/Web Conferencing (Sametime): Building Sametime Enabled Applications

Human-Centered Metaverse

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.