Capítulo 12. Conceitos de inferência
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Nos capítulos anteriores deste livro, focaste-te no treino de modelos utilizando o PyTorch e em como criar modelos que gerem imagens (também conhecido como Visão por Computador), conteúdo de texto (também conhecido como PNL) e modelação de sequências. No resto deste livro, vais abordar muitos conteúdos relacionados com a utilização de modelos treinados para fazer previsões a partir de novos dados (ou seja, inferência) e, em particular, com a utilização de grandes modelos generativos para IA generativa de texto para texto e de texto para imagem.
Mas antes de começares, é importante que compreendas a tecnologia de transferência de dados subjacente. Falámos um pouco dela nos capítulos sobre formação, mas à medida que te aprofundas no ML - quer na formação quer na inferência - é importante que consigas compreender os conceitos subjacentes dos tensores.
Em última análise, independentemente do tipo de dados que tenhas, vais convertê-lo em tensores para o passar para o modelo. Da mesma forma, não importa o tipo de dados em que queres apresentar as respostas do modelo aos teus utilizadores, também as vais receber de volta como tensores!
Em muitos casos, terás funções auxiliares, como os transformadores que verás no Capítulo 15 (que cobre os LLMs) e os difusores que verás no Capítulo 19 (que trata da geração de imagens). E apesar ...