book

Modelli di progettazione dell'IA generativa

by Valliappa Lakshmanan, Hannes Hapke

October 2025

Intermediate to advanced

508 pages

12h 52m

Italian

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

Per chi è questo libro?Convenzioni utilizzate in questo libroUtilizzo di esempi di codiceFormazione online O'ReillyCome contattarciRingraziamenti
Modelli di progettazione GenAICostruire sui modelli fondamentaliprompt e contestoUsare l'API del Model ProviderUsare un framework LLM-agnosticoEseguire il modello a livello localeCome vengono creati i modelli fondazionaliIl panorama dei modelli fondazionaliIA agenzialeL'autonomiaCaratteristiche degli agentiControllo a grana fineLogitTemperaturaCampionamento Top-KCampionamento del nucleoRicerca a raggieraApprendimento in contestoApprendimento a zero colpiApprendimento a pochi colpiPost-formazioneMetodi di post-formazioneMessa a punto di un modello di frontieraMessa a punto di un modello a peso apertoConsiderazioniL'organizzazione del resto del libro
Modello 1: Mascheramento dei logitiProblemaSoluzioneEsempiConsiderazioniRiferimentiModello 2: GrammaticaProblemaSoluzioneEsempiConsiderazioniRiferimentiModello 3: Trasferimento di stileProblemaSoluzioneConsiderazioniRiferimentiSchema 4: Neutralizzazione inversaProblemaSoluzioneEsempio 1: Generazione di un testo legaleEsempio 2: Stile personaleConsiderazioniRiferimentiSchema 5: Ottimizzazione del contenutoProblemaSoluzioneEsempioConsiderazioniRiferimentiRiassunto
Modello 6: RAG di baseProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 7: Indicizzazione semanticaProblemaSoluzioneEsempioConsiderazioniRiferimentiModello 8: Indicizzazione su scalaProblemaSoluzioneEsempioConsiderazioniRiferimentiRiassunto
Schema 9: Recupero consapevole dell'indiceProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 10: Postelaborazione dei nodiProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 11: Generazione affidabileProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 12: Ricerca profondaProblema SoluzioneEsempioConsiderazioniRiferimentiRiassunto
I limiti del ragionamento LLMCapacità conosciuteCapacità sconosciuteSchema 13: Catena di pensieriProblemaSoluzioneEsempiConsiderazioniRiferimentiSchema 14: Albero dei pensieri (ToT)ProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 15: Sintonizzazione dell'adattatoreProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 16: Evol-InstructProblemaSoluzioneEsempioConsiderazioniRiferimentiRiassunto
Schema 17: LLM come giudiceProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 18: RiflessioneProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 19: Iniezione di dipendenzaProblemaEsempioSoluzioneConsiderazioniRiferimentiSchema 20: Ottimizzazione del promptProblemaSoluzioneEsempioConsiderazioniRiferimentiRiassunto
Schema 21: Chiamata di strumentiProblemaSoluzioneEsempioStrumento meteoStrumento di geocodificaServer MCPClient MCPConsiderazioniMigliorare l'affidabilitàLimitazioni di MCPIniezione di promptRiferimentiSchema 22: Esecuzione del codiceProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 23: Collaborazione multiagenteProblemaSoluzioneEsempioConsiderazioniRiferimentiRiepilogo
Schema 24: Modello di linguaggio piccoloProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 25: Caching dei promptProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 26: Ottimizzazione dell'inferenzaProblemaSoluzioneEsempioRiferimentiSchema 27: Test di degradoProblemaSoluzioneStrumenti di monitoraggio delle prestazioniRiferimentiModello 28: Memoria a lungo termineProblemaSoluzioneEsempioConsiderazioniRiferimentiRiassunto
Schema 29: Generazione di modelliProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 30: Riformattazione assemblataProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 31: AutoverificaProblemaSoluzioneEsempioConsiderazioniRiferimentiSchema 32: GuardrailProblemaSoluzioneEsempioConsiderazioniRiferimentiSintesi

Flusso di lavoro agenzialeEsecuzione dell'applicazioneCosa fa l'applicazioneArchitettura del sistemaDistribuzioneSommario

Content preview from Modelli di progettazione dell'IA generativa

Chapter 5. Extending Model Capabilities

LLMs excel at recognizing patterns in vast amounts of data. They can generate coherent and contextually relevant responses by statistically predicting the next token. However, this doesn’t necessarily mean they can genuinely understand the underlying concepts. If you have a task that is not well covered by the training regimen of your foundational model, then the model may not be able to perform that task. This chapter discusses four patterns you can use to teach foundational models tasks that they were not trained to perform.

The Limits of LLM Reasoning

Foundational models can manipulate symbols and words effectively, but this may be because they are generalizing from the manipulation they have encountered in the training data, not because they grasp semantic meanings and the logical relationships between them in the way humans do. While you can use foundational models to perform many tasks, that’s because those tasks are similar to the tasks that the foundational model was trained to do.

It’s difficult to describe tasks that foundational models can’t do well—and that’s because they’ll be esoteric or industry-specific tasks that a more general audience, such as the readership of this book, will not understand. Tasks that aren’t well captured by the training data of LLMs include writing a memo to the investment committee of a mutual fund or adjudicating an internal investigation because such memos are internal records and such investigations ...