Prefazione di Jim Dowling
Ilya Sutskever, figura di spicco nello sviluppo dei modelli linguistici di grandi dimensioni (LLMs), ha affermato che, poiché gli LLMs sono in grado di prevedere con precisione il token successivo, comprendono la realtà sottostante che ha portato alla creazione di quel token. In altre parole, gli LLMs possiedono un modello interno del mondo basato sul linguaggio. Il modello interno dell’LLM è in grado di ragionare su qualsiasi cosa nel mondo, a condizione che venga prima trasformata nel linguaggio su cui l’LLM è stato addestrato. L'LLM possiede una conoscenza enciclopedica del mondo ed è in grado di rispondere alle query utilizzando l'enorme volume di conoscenze acquisite dal vasto numero di documenti su cui è stato addestrato.
Ma se vuoi che un LLM fornisca approfondimenti su qualsiasi cosa sia successa dopo la data di chiusura del suo addestramento, devi includere tutte le informazioni rilevanti (note come contesto) nel tuo prompt all'LLM in modo che possa rispondere alla domanda. Gli LLMs possono persino imparare e generalizzare dal contesto che fornisci, in quello che è noto come apprendimento contestuale. Ma se conversi direttamente con un LLM (non tramite un chatbot), sarà come parlare con Leonard Shelby di Memento, che tragicamente non riusciva a formare nuovi ricordi a lungo termine. I chatbot ti danno l’illusione che l’LLM abbia una memoria, poiché forniscono l’intera conversazione come contesto in ogni prompt.
In un certo senso, gli LLMs sono ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access