Capítulo 7. Modelos basados en la energía
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Modelos basados en la energía son una amplia clase de modelos generativos que toman prestada una idea clave del modelado de sistemas físicos, a saber, que la probabilidad de un suceso puede expresarse mediante una distribución de Boltzmann, una función específica que normaliza una función de energía de valor real entre 0 y 1. Esta distribución fue formulada originalmente en 1868 por Ludwig Boltzmann, que la utilizó para describir gases en equilibrio térmico.
En este capítulo, veremos cómo podemos utilizar esta idea para entrenar un modelo generativo que sirva para producir imágenes de dígitos manuscritos. Exploraremos varios conceptos nuevos, como la divergencia contrastiva para entrenar el EBM y la dinámica de Langevin para el muestreo.
Introducción
En empezaremos con una breve historia para ilustrar los conceptos clave de los modelos basados en la energía.
Get Aprendizaje profundo generativo, 2ª edición now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.