Capítulo 7. Modelos baseados na energia
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Modelos baseados em energia são uma classe alargada de modelos generativos que utilizam uma ideia-chave da modelação de sistemas físicos - nomeadamente, que a probabilidade de um evento pode ser expressa através de uma distribuição de Boltzmann, uma função específica que normaliza uma função de energia de valor real entre 0 e 1. Esta distribuição foi originalmente formulada em 1868 por Ludwig Boltzmann, que a utilizou para descrever gases em equilíbrio térmico.
Neste capítulo, veremos como podemos utilizar esta ideia para treinar um modelo generativo que pode ser utilizado para produzir imagens de dígitos manuscritos. Exploraremos vários conceitos novos, incluindo a divergência contrastiva para treinar o MBE e a dinâmica de Langevin para amostragem.
Introdução
Nós começaremos com uma pequena história para ilustrar os conceitos-chave subjacentes aos modelos baseados na energia. ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access