Capitolo 7. Tecniche avanzate di messa a punto
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nel capitolo precedente abbiamo presentato il modo canonico per mettere a punto un tipico LLM. Nel mondo reale, le motivazioni per aggiornare un LLM sono molteplici e, allo stesso modo, i modi per aggiornarlo sono molteplici. In questo capitolo descriveremo diverse tecniche avanzate di messa a punto e metteremo in evidenza gli scenari in cui ciascuna tecnica è adatta.
Perché vuoi aggiornare i parametri di un LLM? Abbiamo accennato a questo aspetto nei capitoli precedenti, ma ora analizziamolo più in dettaglio:
- Adattamento del dominio
-
I dati con cui lavoriamo appartengono a un dominio specializzato con cui il LLM potrebbe non aver familiarizzato durante la fase di pre-addestramento. In questo caso, vorremmo aggiornare il modello addestrandolo su dati specifici del dominio.
- Adattamento al compito
-
Ci interessano le prestazioni dell'LLM su compiti specifici a valle. Per migliorare le prestazioni di LLM in questi compiti, possiamo addestrarlo con dati specifici. L'addestramento può essere supervisionato o non supervisionato.
- Aggiornamento delle conoscenze
-
Vogliamo mantenere aggiornate le conoscenze del LLM formandolo continuamente su nuovi dati.
- Controllabilità/sterzabilità
-
Vorremmo controllare il comportamento del LLM, rendendolo più propenso a seguire le richieste dell'utente scritte in linguaggio ...