Processamento de linguagem natural com transformadores, edição revisada
by Lewis Tunstall, Leandro von Werra, Thomas Wolf
Capítulo 3. Anatomia do transformador
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
No Capítulo 2, vimos o que é preciso para afinar e avaliar um transformador. Agora vamos dar uma olhada em como eles funcionam nos bastidores. Neste capítulo, exploraremos os principais blocos de construção dos modelos de transformadores e como implementá-los usando o PyTorch. Também forneceremos orientações sobre como fazer o mesmo no TensorFlow. Primeiro, vamos nos concentrar na construção do mecanismo de atenção e, em seguida, adicionar os bits e peças necessários para fazer um codificador de transformador funcionar. Também vamos dar uma breve olhada nas diferenças arquitetônicas entre os módulos codificador e decodificador. No final deste capítulo, você será capaz de implementar um modelo simples de transformador!
Embora um conhecimento técnico profundo da arquitetura do Transformer não seja geralmente necessário para utilizar
Transformers e afinar modelos para o teu caso de utilização, pode ser útil para compreender e navegar pelas limitações dos transformers e utilizá-los em novos domínios.
Este capítulo também apresenta uma taxonomia de transformadores para te ajudar a entender o zoológico de modelos que surgiram nos últimos anos. Antes de mergulhar no código, vamos começar com uma visão geral da arquitetura original ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access