Capitolo 7. Modelli basati sull'energia
Questo lavoro è stato tradotto utilizzando l'AI. Siamo lieti di ricevere il tuo feedback e i tuoi commenti: translation-feedback@oreilly.com
Modelli basati sull'energia sono un'ampia classe di modelli generativi che prendono in prestito un'idea chiave dalla modellazione dei sistemi fisici, ovvero che la probabilità di un evento può essere espressa utilizzando una distribuzione di Boltzmann, una funzione specifica che normalizza una funzione energetica a valore reale tra 0 e 1. Questa distribuzione fu originariamente formulata nel 1868 da Ludwig Boltzmann, che la utilizzò per descrivere i gas in equilibrio termico.
In questo capitolo vedremo come utilizzare questa idea per addestrare un modello generativo che possa essere utilizzato per produrre immagini di cifre scritte a mano. Esploreremo diversi nuovi concetti, tra cui la divergenza contrastiva per l'addestramento dell'EBM e la dinamica di Langevin per il campionamento.
Introduzione
Noi di inizieremo con una breve storia per illustrare i concetti chiave dei ...