Capítulo 9. Análisis gráfico del texto
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hasta ahora, hemos aplicado al texto los algoritmos tradicionales de clasificación y agrupación. Al permitirnos medir distancias entre términos, asignar pesos a frases y calcular probabilidades de enunciados, estos algoritmos nos permiten razonar sobre las relaciones entre documentos. Sin embargo, tareas como la traducción automática, la respuesta a preguntas y el seguimiento de instrucciones suelen requerir un razonamiento semántico más complejo.
Por ejemplo, dado un gran número de artículos de noticias, ¿cómo construirías un modelo de las narraciones que contienen, de las acciones realizadas por los actores clave o de las que se ejercen sobre otros, de la secuencia de los acontecimientos, de la causa y el efecto? Utilizando las técnicas del Capítulo 7, podrías extraer las entidades o frases clave o buscar temas utilizando los métodos de modelado de temas descritos en el Capítulo 6. Pero para modelar la información sobre las relaciones entre esas entidades, frases y temas, necesitarías otro tipo de estructura de datos.
Consideremos cómo pueden expresarse esas relaciones en los titulares de algunos de nuestros artículos:
headlines
=
[
'FDA approves gene therapy'
,
'Gene therapy reduces tumor growth'
,
'FDA recalls pacemakers'
]
Tradicionalmente, las frases de este tipo se codifican mediante representaciones del significado del ...
Get Análisis de Texto Aplicado con Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.