Capitolo 12. Concetti di inferenza
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Nei capitoli precedenti di questo libro ti sei concentrato sull'addestramento di modelli utilizzando PyTorch e su come creare modelli che gestiscono immagini (alias Computer Vision), contenuti testuali (alias NLP) e modelli di sequenze. Nel resto di questo libro, verranno trattati molti contenuti relativi all'utilizzo di modelli addestrati per fare previsioni da nuovi dati (alias inferenza) e in particolare all'utilizzo di modelli generativi di grandi dimensioni per l'IA generativa testo-testo e testo-immagine.
Ma prima di affrontare questo argomento, è importante che tu comprenda la tecnologia di trasferimento dei dati sottostante. Ne abbiamo parlato un po' nei capitoli sull'addestramento, ma man mano che ti addentrerai nel ML - sia per l'addestramento che per l'inferenza - è importante che tu sia in grado di comprendere i concetti di base dei tensori.
In definitiva, indipendentemente dal tipo di dati , li convertirai in tensori per passarli al modello. Allo stesso modo, indipendentemente dal tipo di dati in cui vuoi presentare le risposte del modello ai tuoi utenti, le riceverai come tensori!
In molti casi, avrai a disposizione delle funzioni di aiuto, come i trasformatori che vedrai nel Capitolo 15 (che tratta gli LLMs) e i diffusori che vedrai nel Capitolo 19 (che si occupa della generazione di immagini). ...