Capítulo 10. Profundización en PNL: RNNs
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el Capítulo 1, vimos que el aprendizaje profundo puede utilizarse para obtener grandes resultados con conjuntos de datos de lenguaje natural. Nuestro ejemplo se basaba en utilizar un modelo de lenguaje preentrenado y ajustarlo para clasificar reseñas. Ese ejemplo puso de relieve una diferencia entre el aprendizaje por transferencia en PNL y la visión por ordenador: en general, en PNL el modelo preentrenado se entrena en una tarea diferente.
Lo que llamamos modelo lingüístico es un modelo que ha sido entrenado para adivinar la siguiente palabra de un texto (habiendo leído las anteriores). Este tipo de tarea se denomina aprendizaje autosupervisado: no necesitamos dar etiquetas a nuestro modelo, basta con alimentarlo con montones y montones de textos. Tiene un proceso para obtener etiquetas automáticamente a partir de los datos, y esta tarea no es trivial: para adivinar correctamente la siguiente palabra de una frase, el modelo tendrá que desarrollar una comprensión de la lengua inglesa (u otra). El aprendizaje autosupervisado también puede utilizarse en otros dominios; por ejemplo, consulta"Aprendizaje autosupervisado y visión por ordenador" para una introducción a las aplicaciones de visión. El aprendizaje autosupervisado no suele utilizarse para el modelo que se entrena directamente, sino que se utiliza para el preentrenamiento ...