Sistemas de produção de aprendizagem automática
by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Capítulo 6. Técnicas de gestão de recursos modelo
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Os sistemas de computação, armazenamento e E/S que seu modelo requer determinarão quanto custará para colocar seu modelo em produção e mantê-lo durante toda a sua vida útil. Neste capítulo, veremos algumas técnicas importantes que podem nos ajudar a gerenciar os requisitos de recursos do modelo. Concentrar-nos-emos em três áreas-chave que são as principais formas de otimizar modelos tanto no ML tradicional como na IA generativa (GenAI):
-
Redução da dimensionalidade
-
Quantificação dos parâmetros do modelo e poda dos gráficos do modelo
-
Destilação do conhecimento para captar o conhecimento contido em grandes modelos
Redução da dimensionalidade: Efeito da dimensionalidade no desempenho
Começaremos por discutir a dimensionalidade e a forma como esta afecta o desempenho do nosso modelo e os requisitos de recursos.
Num passado não muito distante, a geração de dados e, até certo ponto, o armazenamento de dados eram muito mais dispendiosos do que são atualmente. Nessa altura, muitos peritos do domínio consideravam cuidadosamente quais as caraterísticas ou variáveis a medir antes de conceberem as suas experiências e transformações de caraterísticas. Consequentemente, esperava-se que os conjuntos de dados fossem bem concebidos e que, potencialmente, contivessem apenas um pequeno número de caraterísticas relevantes. ...