Capítulo 2. Introdução aos modelos de linguagem de grande dimensão para a geração de texto
Este trabalho foi traduzido com recurso a IA. Agradecemos o teu feedback e comentários: translation-feedback@oreilly.com
No domínio da inteligência artificial, a evolução dos modelos linguísticos de grande dimensão tem merecido uma atenção especial. Ao contrário dos seus antecessores menos flexíveis, os LLMs são capazes de lidar e aprender com um volume muito maior de dados, o que resulta na capacidade emergente de produzir texto que se assemelha muito à linguagem humana. Estes modelos generalizaram-se a diversas aplicações, desde a escrita de conteúdos à automatização do desenvolvimento de software e à criação de experiências de chatbot interactivas em tempo real.
O que são modelos de geração de texto?
Os modelos de geração de texto utilizam algoritmos avançados para compreender o significado do texto e produzir resultados que são frequentemente indistinguíveis do trabalho humano. Se alguma vez interagiste com o ChatGPT ou ficaste maravilhado com a sua capacidade de criar frases coerentes e contextualmente relevantes, testemunhaste o poder de um LLM em ação.
No processamento de linguagem natural (PNL) e nos LLMs, a unidade linguística fundamental é um token. Os tokens podem representar frases, palavras ou mesmo sub-palavras, como um conjunto de caracteres. Uma forma útil de compreender o tamanho dos dados de texto é observar o número de tokens que os compõem; por exemplo, um texto de ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access