Capítulo 8. Utilizar o ML para criar texto
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
Com o lançamento do ChatGPT em 2022, as palavras IA generativa entraram no léxico comum. Esta aplicação simples que te permitia conversar com uma IA baseada na Cloud parecia quase milagrosa na forma como conseguia responder às tuas perguntas com conhecimento de quase tudo na experiência humana. Funcionava utilizando uma evolução muito avançada para além das redes neurais recorrentes que viste no último capítulo, utilizando uma técnica chamada transformadores.
Um transformador aprende os padrões que transformam um pedaço de texto em outro. Com uma arquitetura de transformador suficientemente grande e um conjunto de texto suficientemente grande para aprender, o modelo GPT (GPT significa generative pretrained transformers) poderia prever os próximos tokens a seguir a um pedaço de texto. Quando o GPT foi envolvido numa aplicação que o tornou mais fácil de utilizar, nasceu toda uma nova indústria.
Embora a criação de modelos com transformadores esteja fora do âmbito deste livro, analisaremos a sua arquitetura em pormenor no Capítulo 15.
Os princípios envolvidos no treinamento de modelos com transformadores podem ser replicados com arquiteturas menores e mais simples, como RNNs ou LSTM. Vamos explorar isso neste capítulo e com um corpus muito mais pequeno de texto - canções tradicionais irlandesas.
Assim, por exemplo, considera ...