book

Engenharia de IA

Name: Engenharia de IA
Author: Chip Huyen
ISBN: 9798341637870

by Chip Huyen

October 2025

Intermediate to advanced

534 pages

16h 55m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Audio summary available

Read now

Unlock full access

Prefácio
Sobre o que é este livroO que este livro não éPara quem é este livroComo navegar neste livroConvenções usadas neste livroUsando exemplos de códigoAprendizado on-line da O'ReillyComo entrar em contato conoscoAgradecimentos
1. Introdução à criação de aplicativos de IA com modelos de base
A ascensão da engenharia de IADe modelos de linguagem a modelos de linguagem grandesDos grandes modelos de linguagem aos modelos básicosDos modelos básicos à engenharia de IACasos de uso do modelo básicoCodificaçãoProdução de imagens e vídeosRedaçãoEducaçãoBots de conversaçãoAgregação de informaçõesOrganização de dadosAutomação do fluxo de trabalhoPlanejamento de aplicativos de IAAvaliação de casos de usoDefinição de expectativasPlanejamento de marcosManutençãoA pilha de engenharia de IATrês camadas da pilha de IAEngenharia de IA versus engenharia de MLEngenharia de IA versus engenharia de pilha completaResumo
2. Entendendo os Foundation Models
Dados de treinamentoModelos multilínguesModelos específicos de domínioModelagemArquitetura de modelosTamanho do modeloPós-treinamentoAjuste fino supervisionadoAjuste de preferênciasAmostragemFundamentos de amostragemEstratégias de amostragemTempo de teste ComputarSaídas estruturadasA natureza probabilística da IAResumo
3. Metodologia de avaliação
Desafios da avaliação de modelos de fundaçãoEntendendo as métricas de modelagem de linguagemEntropiaEntropia cruzadaBits por caractere e Bits por bytePerplexidadeInterpretação da perplexidade e casos de usoAvaliação exataCorreção funcionalMedições de similaridade em relação a dados de referênciaIntrodução à incorporaçãoIA como juizPor que a IA como juiz?Como usar a IA como juizLimitações da IA como juizQuais modelos podem atuar como juízes?Modelos de classificação com avaliação comparativaDesafios da avaliação comparativaO futuro da avaliação comparativaResumo
4. Avaliação de sistemas de IA
Critérios de avaliaçãoCapacidade específica do domínioCapacidade de geraçãoCapacidade de seguir instruçõesCusto e latênciaSeleção de modelosFluxo de trabalho de seleção de modelosCriação de modelo versus compraNavegue pelos benchmarks públicosProjetar seu pipeline de avaliaçãoEtapa 1. Avaliar todos os componentes de um sistemaEtapa 2. Criar uma diretriz de avaliação Etapa 3. Definir métodos e dados de avaliaçãoResumo
5. Engenharia imediata
Introdução ao promptAprendizagem no contexto: Zero-Shot e Few-ShotPrompt do sistema e prompt do usuárioDuração do contexto e eficiência do contextoPráticas recomendadas de engenharia de promptsEscreva instruções claras e explícitasFornecer contexto suficienteDivida as tarefas complexas em subtarefas mais simplesDê tempo para o modelo pensarItere em seus promptsAvalie as ferramentas de engenharia de promptOrganize e controle a versão dos promptsEngenharia defensiva de promptsPrompts proprietários e engenharia reversa de promptsJailbreaking e injeção de promptExtração de informaçõesDefesas contra ataques de promptResumo
6. RAG e agentes
RAGArquitetura do RAGAlgoritmos de recuperaçãoOtimização de recuperaçãoRAG além dos textosAgentesVisão geral do agenteFerramentasPlanejamentoModos de falha e avaliação do agenteMemóriaResumo
7. Ajuste fino
Visão geral do ajuste finoQuando fazer o ajuste finoRazões para fazer o ajuste finalMotivos para não fazer o ajuste finoAjuste fino e RAGGargalos de memóriaBackpropagation e parâmetros treináveisMatemática da memóriaRepresentações numéricasQuantizaçãoTécnicas de ajuste finoAjuste fino eficiente de parâmetrosFusão de modelos e ajuste fino de várias tarefasTáticas de ajuste finoResumo
8. Engenharia de conjunto de dados
Curadoria de dadosQualidade dos dadosCobertura de dadosQuantidade de dadosAquisição e anotação de dadosAumento e síntese de dadosPor que a síntese de dadosTécnicas tradicionais de síntese de dadosSíntese de dados com tecnologia de IADestilação de modelosProcessamento de dadosInspecionar dadosDeduplicação de dadosLimpar e filtrar dadosFormatar dadosResumo
9. Otimização da inferência
Entendendo a otimização da inferênciaVisão geral da inferênciaMétricas de desempenho de inferênciaAceleradores de IAOtimização de inferência Otimização de modelosOtimização do serviço de inferênciaResumo

10. Arquitetura de engenharia de IA e feedback do usuário
Arquitetura de engenharia de IAEtapa 1. Aprimorar o contextoEtapa 2. Colocar grades de proteçãoEtapa 3. Adicionar roteador modelo e gatewayEtapa 4. Reduzir a latência com cachesEtapa 5. Adicionar padrões de agenteMonitoramento e observabilidadeOrquestração de pipeline de IAFeedback do usuárioExtração de feedback de conversaçãoDesign de feedbackLimitações do feedbackResumo
Epílogo
Índice
Sobre o autor

Content preview from Engenharia de IA

Capítulo 2. Entendendo os modelos de base

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

Para criar aplicativos com modelos básicos, primeiro você precisa de modelos básicos. Embora você não precise saber como desenvolver um modelo para usá-lo, um entendimento de alto nível o ajudará a decidir qual modelo usar e como adaptá-lo às suas necessidades.

O treinamento de um modelo básico é um processo incrivelmente complexo e caro. Aqueles que sabem como fazer isso bem provavelmente estão impedidos, por acordos de confidencialidade, de divulgar o molho secreto. Este capítulo não poderá dizer a você como criar um modelo para competir com o ChatGPT. Em vez disso, vou me concentrar nas decisões de design com impacto consequente nos aplicativos downstream.

Com a crescente falta de transparência no processo de treinamento de modelos de base, é difícil que você saiba todas as decisões de design necessárias para a criação de um modelo. No entanto, em geral, as diferenças nos modelos de fundação podem ser atribuídas a decisões sobre dados de treinamento, arquitetura e tamanho do modelo e como eles são pós-treinados para se alinharem às preferências humanas.

Como os modelos aprendem com os dados, seus dados de treinamento revelam muito sobre suas capacidades e limitações. Este capítulo começa com a forma como os desenvolvedores de modelos selecionam os dados de treinamento, concentrando-se na distribuição dos dados de treinamento. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341637870

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Engenharia de IA

by Chip Huyen

Capítulo 2. Entendendo os modelos de base

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.