book

Processamento de linguagem natural com transformadores, edição revisada

Name: Processamento de linguagem natural com transformadores, edição revisada
ISBN: 9798341641341

by Lewis Tunstall, Leandro von Werra, Thomas Wolf

April 2025

Intermediate to advanced

408 pages

11h 50m

Portuguese (Portugal, Brazil)

O'Reilly Media, Inc.

Read now

Unlock full access

Prefácio
Prefácio
Para quem é este livro?O que vais aprenderRequisitos de software e hardwareConvenções utilizadas neste livroUtilizar exemplos de códigoAprendizagem em linha da O'ReillyComo contactar-nosAgradecimentosLewisLeandroTomás
1. Olá, Transformers
A estrutura codificador-decodificadorMecanismos de atençãoAprendizagem por transferência em PNLTransformadores de rostos abraçados: Colmatar o fossoUma visita às aplicações dos transformadoresClassificação do textoReconhecimento de entidades nomeadasResposta a perguntasSumarizaçãoTraduçãoGeração de textoO Ecossistema da Cara de AbraçoO Centro da Cara de AbraçoTokenizadores de rostos abraçadosConjuntos de dados de rostos abraçadosCara de abraço AceleraPrincipais desafios dos transformadoresConclusão
2. Classificação do texto
O conjunto de dadosUm primeiro olhar sobre os conjuntos de dados de rostos abraçadosDe conjuntos de dados a DataFramesVerificação da distribuição de classesQuanto tempo duram os teus tweets?Do texto aos tokensTokenização de caracteresTokenização de palavrasTokenização de subpalavrasTokenizar todo o conjunto de dadosTreinar um classificador de textoTransformadores como extractores de caraterísticasTransformadores de ajuste finoConclusão
3. Anatomia do transformador
A arquitetura do transformadorO codificadorAuto-atençãoA camada de alimentaçãoAdicionar normalização de camadasEmbeddings posicionaisAdicionar uma cabeça de classificaçãoO descodificadorConhece os TransformersA Árvore da Vida dos TransformersO ramo codificadorO ramo descodificadorO ramo codificador-decodificadorConclusão
4. Reconhecimento multilingue de entidades nomeadas
O conjunto de dadosTransformadores MultilinguesUm olhar mais atento à TokenizaçãoO pipeline do TokenizerO Tokenizer SentencePieceTransformadores para reconhecimento de entidades nomeadasA anatomia da classe de modelos TransformersCorpos e cabeçasCriação de um modelo personalizado para classificação de tokensCarregamento de um modelo personalizadoTokenização de textos para NERMedidas de desempenhoAfinação do XLM-RoBERTaAnálise de errosTransferência entre línguasQuando é que a transferência de tiro zero faz sentido?Afinação de várias línguas em simultâneoInteragir com widgets de modeloConclusão
5. Geração de texto
O desafio de gerar um texto coerenteDescodificação por pesquisa gulosaDescodificação de pesquisa de feixeMétodos de amostragemAmostragem Top-k e de NúcleosQual é o melhor método de descodificação?Conclusão
6. Sumarização
O conjunto de dados CNN/DailyMailPipelines de Sumarização de TextoSumarização Linha de baseGPT-2T5BARTPEGASUSComparação de resumos diferentesMedir a qualidade do texto geradoBLEUROUGEAvaliação do PEGASUS no conjunto de dados CNN/DailyMailTreinar um modelo de compactaçãoAvaliação do PEGASUS no SAMSumAfinação do PEGASUSGeração de resumos de diálogosConclusão
7. Resposta a perguntas
Criar um sistema de garantia de qualidade baseado em revisõesO conjunto de dadosExtrair respostas do textoUsando o Haystack para criar um pipeline de QAMelhorar o nosso pipeline de garantia de qualidadeAvaliação do RetrieverAvaliar o leitorAdaptação do domínioAvaliação de todo o pipeline de QAGo beyond Extractive QAConclusão
8. Tornar os transformadores eficientes na produção
A deteção de intenções como um caso de estudoCriar uma referência de desempenhoTornar os modelos mais pequenos através da destilação de conhecimentosDestilação de conhecimentos para afinaçãoDestilação de conhecimentos para pré-treinoCriar um formador de destilação de conhecimentosEscolhendo uma boa inicialização de alunoEncontrar bons hiperparâmetros com o OptunaAferição do nosso modelo destiladoTornar os modelos mais rápidos com a quantizaçãoAferição do nosso modelo quantizadoOtimizar a inferência com ONNX e o tempo de execução ONNXTornar os modelos mais esparsos com a poda de pesosEsparsidade em redes neurais profundasMétodos de poda de pesoConclusão

9. Lidar com poucos ou nenhuns rótulos
Criar um marcador de problemas do GitHubObter os dadosPreparar os dadosCriar conjuntos de treinamentoCriar cortes de formaçãoImplementação de um Naive BayeslineTrabalhar com dados não rotuladosTrabalhar com algumas etiquetasAumento de dadosUtilizar Embeddings como uma tabela de pesquisaAfinação de um transformador VanillaAprendizagem em contexto e de poucas oportunidades com promptAproveitamento de dados não rotuladosAfinar um modelo linguísticoAfinação de um classificadorMétodos avançadosConclusão
10. Treinar transformadores a partir do zero
Grandes conjuntos de dados e onde encontrá-losDesafios da construção de um corpus de grande escalaCriar um conjunto de dados de código personalizadoTrabalhar com grandes conjuntos de dadosAdicionando conjuntos de dados ao hub de rostos abraçadosCriar um TokenizerO modelo do TokenizerMedir o desempenho do TokenizerUm Tokenizer para PythonTreinar um TokenizerGuardar um Tokenizer Personalizado no HubTreinar um modelo a partir do zeroUma história de objectivos de pré-formaçãoInicialização do modeloImplementar o carregador de dadosDefinir o circuito de formaçãoA corrida de treinoResultados e análiseConclusão
11. Direcções futuras
Transformadores de escalaLeis de escalaDesafios com a escalaAtenção, por favor!Atenção esparsaAtenção LinearizadaVai para além do textoVisãoTabelasTransformadores multimodaisFala para textoVisão e textoPara onde vais a partir daqui?
Índice
Sobre os autores

Content preview from Processamento de linguagem natural com transformadores, edição revisada

Capítulo 10. Treinar transformadores a partir do zero

Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com

No parágrafo de abertura deste livro, mencionámos uma aplicação sofisticada chamada GitHub Copilot que utiliza transformadores do tipo GPT para executar o preenchimento automático de código, uma funcionalidade que é particularmente útil quando se programa numa nova linguagem ou estrutura ou quando se aprende a codificar, ou para produzir automaticamente código padrão. Outros produtos que utilizam modelos de IA para este fim incluem o TabNine eo Kite. Mais tarde, no Capítulo 5, vimos mais de perto como podemos usar modelos GPT para gerar texto de alta qualidade. Neste capítulo, vamos fechar o círculo e construir o nosso próprio modelo tipo GPT para gerar código fonte Python! Chamamos o modelo resultante de CodeParrot.

Até agora, trabalhámos sobretudo em aplicações com restrições de dados, em que a quantidade de dados de treino rotulados é limitada. Nestes casos, a aprendizagem por transferência ajudou-nos a construir modelos com bom desempenho. Levámos a aprendizagem por transferência ao limite no Capítulo 9, onde quase não utilizámos quaisquer dados de treino.

Neste capítulo, vamos passar para o outro extremo e ver o que podemos fazer quando estamos a afogar-nos em todos os dados que poderíamos desejar. Exploraremos a etapa de pré-treinamento em si e aprenderemos a treinar um transformador a partir do zero. ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Processamento prático de linguagem natural

Publisher Resources

ISBN: 9798341641341

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Processamento de linguagem natural com transformadores, edição revisada

by Lewis Tunstall, Leandro von Werra, Thomas Wolf

Capítulo 10. Treinar transformadores a partir do zero

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.