IA generativa prática com transformadores e modelos de difusão
by Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker
Capítulo 3. Compressão e representação de informações
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Este capítulo de apresenta modelos e técnicas de ML para aprender representações de dados eficientes para tarefas que envolvem imagens, vídeos ou texto. Porque é que as representações eficientes são importantes? Queremos reduzir a quantidade de informações que precisamos armazenar e processar, mantendo as caraterísticas essenciais dos dados. Representações ricas permitem treinar modelos especializados em tarefas específicas, e tornar as representações compactas reduz os requisitos computacionais para treinar e trabalhar com modelos de dados intensivos. Por exemplo, o treino num vetor de uma imagem pode ser mais eficiente e expressivo do que fazê-lo diretamente nos seus pixels.
Os métodos tradicionais de compressão , como o ZIP ou o JPEG, centram-se em tipos de dados específicos e utilizam algoritmos artesanais para reduzir o tamanho dos ficheiros. Embora esses métodos sejam eficazes para os fins pretendidos, eles não têm a flexibilidade e a adaptabilidade das técnicas de compactação aprendidas. O ZIP, por exemplo, é excelente na compressão sem perdas de dados gerais, identificando e codificando padrões repetitivos. Por outro lado, o JPEG foi concebido especificamente para a compressão de imagens e consegue uma redução significativa do tamanho, descartando informações visuais menos perceptíveis. No entanto, ...