Capítulo 7. Cómo explicar un clasificador de texto

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En los capítulos anteriores, hemos aprendido mucho sobre métodos analíticos avanzados para datos de texto no estructurados. Partiendo de la estadística y utilizando la PNL, hemos encontrado interesantes perspectivas a partir del texto.

Utilizando métodos supervisados de clasificación, hemos asignado documentos de texto a categorías ya dadas mediante algoritmos de entrenamiento. Aunque hemos comprobado la calidad del proceso de clasificación, nos hemos saltado un aspecto importante: no tenemos ni idea de por qué el modelo ha decidido asignar una categoría a un texto.

Esto podría parecer poco importante si la categoría fuera correcta. Sin embargo, en la vida cotidiana a menudo tienes que explicar tus propias decisiones y hacerlas transparentes a los demás. Lo mismo ocurre con los algoritmos de aprendizaje automático.

En los proyectos de la vida real, la mayoría de las veces oirás la pregunta "¿Por qué el algoritmo ha asignado esta categoría/sentimiento?". Incluso antes de eso, comprender cómo ha aprendido algo el algoritmo te ayudará a mejorar la clasificación utilizando diferentes algoritmos, añadiendo características, cambiando pesos, etc. En comparación con los datos estructurados, la pregunta es mucho más importante con el texto, ya que los humanos pueden interpretar el propio texto. Además, el texto tiene muchos ...

Get Planos para el análisis de textos con Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.