Skip to Content
Recetario de Aprendizaje Automático con Python, 2ª Edición
book

Recetario de Aprendizaje Automático con Python, 2ª Edición

by Kyle Gallatin, Chris Albon
September 2024
Intermediate to advanced
416 pages
8h 38m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Recetario de Aprendizaje Automático con Python, 2ª Edición

Capítulo 6. Manejo del texto

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

6.0 Introducción

Los datos de texto no estructurados de , como el contenido de un libro o un tweet, son a la vez una de las fuentes más interesantes de características y una de las más complejas de manejar. En este capítulo, trataremos estrategias para transformar el texto en características ricas en información y utilizaremos algunas características listas para usar (denominadas incrustaciones) que se han vuelto cada vez más ubicuas en tareas que implican procesamiento del lenguaje natural (PLN).

Esto no quiere decir que las recetas aquí tratadas sean exhaustivas. Hay disciplinas académicas enteras que se centran en el tratamiento de datos no estructurados, como el texto. En este capítulo, cubriremos algunas técnicas de uso común; el conocimiento de éstas añadirá valiosas herramientas a nuestra caja de herramientas de preprocesamiento. Además de muchas recetas genéricas de procesamiento de texto, también demostraremos cómo puedes importar y aprovechar algunos modelos de aprendizaje automático preentrenados para generar características de texto más ricas.

6.1 Texto de limpieza

Problema

Tienes algunos datos de texto no estructurados de y quieres completar una limpieza básica.

Solución

En el siguiente ejemplo de , examinamos el texto de tres libros y lo limpiamos utilizando las operaciones de cadena básicas de Python, en concreto ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Patrones de Arquitectura con Python

Patrones de Arquitectura con Python

Harry Percival, Bob Gregory
Planos para el análisis de textos con Python

Planos para el análisis de textos con Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner

Publisher Resources

ISBN: 9781098186814Supplemental Content