Capítulo 2. Clasificación de textos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

La clasificación de textos es una de las tareas más comunes de la PNL; se puede utilizar para una amplia gama de aplicaciones, como etiquetar las opiniones de los clientes en categorías o enrutar las solicitudes de asistencia según su idioma. Lo más probable es que el filtro antispam de tu programa de correo electrónico utilice la clasificación de textos para proteger tu bandeja de entrada de una avalancha de basura no deseada.

Otro tipo común de clasificación de textos es el análisis de sentimientos, que (como vimos en el Capítulo 1) pretende identificar la polaridad de un texto dado. Por ejemplo, una empresa como Tesla podría analizar publicaciones de Twitter como la de la Figura 2-1 para determinar si a la gente le gustan o no los nuevos techos de sus coches.

Tesla Tweet
Figura 2-1. Analizar el contenido de Twitter puede aportar información útil de los clientes (cortesía de Aditya Veluri)

Ahora imagina que eres un científico de datos que necesita construir un sistema que pueda identificar automáticamente estados emocionales como "enfado" o "alegría" que la gente expresa sobre el producto de tu empresa en Twitter. En este capítulo, abordaremos esta tarea utilizando una variante de BERT llamada DistilBERT.1 La principal ventaja de este ...

Get Procesamiento del Lenguaje Natural con Transformadores, Edición Revisada now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.