Capitolo 1. Introduzione ai modelli linguistici di grandi dimensioni
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
L'umanità è a un punto di svolta. A partire da 2012, gli sviluppi nella costruzione di sistemi di intelligenza artificiale (utilizzando reti neurali profonde) hanno subito un'accelerazione tale che, alla fine del decennio, hanno prodotto il primo sistema software in grado di scrivere articoli indistinguibili da quelli scritti dagli esseri umani. Questo sistema era un modello di intelligenza artificiale chiamato Generative Pre-trained Transformer 2 o GPT-2. Il 2022 segnò il rilascio di ChatGPT, che dimostrò quanto questa tecnologia fosse pronta a rivoluzionare il modo in cui interagiamo con la tecnologia e le informazioni. Raggiungendo un milione di utenti attivi in cinque giorni e poi cento milioni di utenti attivi in due mesi, la nuova generazione di modelli di intelligenza artificiale è nata come chatbot simili a quelli umani, ma si è rapidamente evoluta in un cambiamento monumentale nel nostro approccio alle attività più comuni, come la traduzione, la generazione di testi, la sintesi e altro ancora. È diventato uno strumento prezioso per programmatori, educatori e ricercatori.
Il successo di ChatGPT è stato senza precedenti e ha reso popolare la ricerca sulla tecnologia che ne è alla base, ovvero i modelli linguistici di grandi dimensioni (LLMs). Sia i modelli proprietari ...