Capitolo 6. Ingegneria prompt
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
In i primi capitoli di questo libro, abbiamo mosso i primi passi nel mondo dei grandi modelli linguistici (LLMs). Abbiamo approfondito diverse applicazioni, come la classificazione supervisionata e non supervisionata, utilizzando modelli che si concentrano sulla rappresentazione del testo, come BERT e i suoi derivati.
Man mano che procedevamo, abbiamo utilizzato modelli addestrati principalmente per la generazione di testo, modelli che vengono spesso indicati come generative pre-trained transformers (GPT). Questi modelli hanno la notevole capacità di generare testo in risposta ai prompt dell'utente. Grazie all'ingegneria dei prompt, possiamo progettare questi prompt in modo da migliorare la qualità del testo generato.
In questo capitolo esploreremo questi modelli generativi in modo più dettagliato e ci immergeremo nel regno del prompt engineering, del ragionamento con i modelli generativi, della verifica e della valutazione dei loro risultati.
Utilizzo dei modelli di generazione del testo
Prima di iniziare con i fondamenti dell'ingegneria del prompt, è essenziale esplorare le basi dell'utilizzo di un modello di generazione del testo. Come si sceglie il modello da utilizzare? Utilizziamo un modello proprietario o open source? Come possiamo controllare l'output generato? Queste domande ci serviranno come trampolino ...