Skip to Main Content
Procesamiento del Lenguaje Natural con Transformadores, Edición Revisada
book

Procesamiento del Lenguaje Natural con Transformadores, Edición Revisada

by Lewis Tunstall, Leandro von Werra, Thomas Wolf
September 2024
Intermediate to advanced content levelIntermediate to advanced
408 pages
12h 11m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Procesamiento del Lenguaje Natural con Transformadores, Edición Revisada

Capítulo 4. Reconocimiento multilingüe de entidades con nombre

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Hasta ahora en este libro hemos aplicado transformadores para resolver tareas de PLN en corpus ingleses, pero ¿qué haces cuando tus documentos están escritos en griego, swahili o klingon? Un enfoque consiste en buscar en el Hugging Face Hub un modelo lingüístico preentrenado adecuado y ajustarlo a la tarea en cuestión. Sin embargo, estos modelos preentrenados suelen existir sólo para lenguas de "altos recursos" como el alemán, el ruso o el mandarín, en las que se dispone de mucho texto web para el preentrenamiento. Otro reto común surge cuando tu corpus es multilingüe: mantener múltiples modelos monolingües en producción no será nada divertido ni para ti ni para tu equipo de ingenieros.

Afortunadamente, existe una clase de transformadores multilingües que vienen al rescate. Al igual que BERT, estos modelos utilizan el modelado lingüístico enmascarado como objetivo del preentrenamiento, pero se entrenan conjuntamente en textos de más de cien lenguas. Al realizar el preentrenamiento en corpus enormes de muchas lenguas, estos transformadores multilingües permiten la transferencia multilingüe sin necesidad de entrenamiento adicional, lo que significa que un modelo perfeccionado en una lengua puede aplicarse a otras sin necesidad de entrenamiento adicional. Esto también hace que estos modelos sean muy adecuados ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Inteligencia artificial generativa práctica con transformadores y modelos de difusión

Inteligencia artificial generativa práctica con transformadores y modelos de difusión

Omar Sanseviero, Pedro Cuenca, Apolinário Passos, Jonathan Whitaker

Publisher Resources

ISBN: 9781098181468Supplemental Content