Parte I. Inferência
AParte I fala sobre os principais pontos a considerar durante a implantação e execução de um modelo de IA generativa. Isso é abordado primeiro porque, diferentemente dos modelos de IA preditiva, normalmente não se começa do zero criando um modelo básico totalmente novo.
A criação de um modelo básico é uma atividade que exige muitos recursos, tempo e dados, usando técnicas parecidas, mas em uma escala maior. Poucas empresas fazem isso, então não vamos falar sobre isso aqui.
Essa fase do ciclo de vida do modelo não é nova no espaço da IA; o serviço de modelos sempre foi um aspecto central desde o início da adoção da IA em contextos de produção. No entanto, o tamanho e a complexidade desses novos tipos de modelos trazem um conjunto significativo de novos desafios. Além de sua importância histórica, a infraestrutura de inferência ( ) se tornou o principal ponto de entrada para a adoção da IA moderna. Os engenheiros de IA geralmente começam integrando modelos pré-treinados em seus aplicativos existentes por meio de APIs de inferência, o que permite que eles incorporem recursos de IA ao software tradicional sem precisar de profundo conhecimento em Deep Learning. Além disso, a infraestrutura de inferência serve como camada fundamental para sistemas de IA agênciai, nos quais vários modelos e ferramentas devem trabalhar juntos de forma integrada para realizar tarefas complexas.
A IA generativa é um campo muito ativo, e este livro não pretende ser uma lista abrangente ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access