Capítulo 9. Técnicas avançadas para geração de imagens com difusão estável
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
A maior parte do trabalho com imagens de IA requer apenas técnicas simples de engenharia de prompt, mas existem ferramentas mais poderosas disponíveis quando precisas de um controlo mais criativo sobre o teu resultado ou queres treinar modelos personalizados para tarefas específicas. Estas capacidades mais complexas requerem frequentemente mais capacidade técnica e pensamento estruturado como parte do fluxo de trabalho de criação da imagem final.
Todas as imagens deste capítulo são geradas pelo Stable Diffusion XL, salvo indicação em contrário, como nas secções que dependem de extensões como a ControlNet, onde são suportados mais métodos com o modelo v1.5 mais antigo. As técnicas discutidas foram concebidas para serem transferíveis para qualquer modelo futuro ou alternativo. Utilizamos extensivamente a Stable Diffusion WebUI do AUTOMATIC1111 e fornecemos instruções de configuração detalhadas que estavam actualizadas no momento da escrita, mas por favor consulta o repositório oficial para instruções actualizadas, e para diagnosticar quaisquer problemas que encontres.
Executa a difusão estável
O Stable Diffusion é um modelo de geração de imagens de código aberto, pelo que podes executá-lo localmente no teu computador gratuitamente, se tiveres uma GPU NVIDIA ou AMD, ou Apple Silicon, como ...