Capítulo 9. Dimensionamento: Hardware, Infraestrutura e Gestão de Recursos
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Implementar e gerir LLMs apresenta desafios e oportunidades únicas no domínio da infraestrutura e gestão de recursos. Os LLMs, como já viu ao longo deste livro, são computacionalmente intensivos, exigindo recursos substanciais de hardware, armazenamento e rede para operar eficientemente. Quer estejas a utilizar LLMs como um serviço baseado na Cloud, a implementar modelos pré-treinados em centros de dados locais, ou a treinar os teus próprios modelos de raiz, as tuas decisões de infraestrutura influenciarão o seu desempenho, escalabilidade e relação custo-eficácia.
A gestão eficaz de recursos para LLMs envolve a otimização da capacidade de computação, memória e armazenamento. Neste capítulo, exploraremos os principais componentes da infraestrutura para LLMs, incluindo requisitos de hardware e estratégias de implantação. Também discutiremos as melhores práticas para otimizar o uso de recursos, gerenciar custos e manter a confiabilidade em ambientes de produção. Este capítulo irá ajudar-te a compreender as soluções de compromisso envolvidas na gestão de recursos para aplicações de IA em grande escala.
Escolhendo a abordagem correta
Selecionando o método apropriado para usar LLMs depende dos requisitos da aplicação para a qual deseja usá-lo. Para startups ou aplicativos de pequena escala, ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access