Skip to Main Content
Recetario de Aprendizaje Automático con Python, 2ª Edición
book

Recetario de Aprendizaje Automático con Python, 2ª Edición

by Kyle Gallatin, Chris Albon
September 2024
Intermediate to advanced content levelIntermediate to advanced
416 pages
8h 38m
Spanish
O'Reilly Media, Inc.
Book available
Content preview from Recetario de Aprendizaje Automático con Python, 2ª Edición

Capítulo 6. Manejo del texto

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

6.0 Introducción

Los datos de texto no estructurados de , como el contenido de un libro o un tweet, son a la vez una de las fuentes más interesantes de características y una de las más complejas de manejar. En este capítulo, trataremos estrategias para transformar el texto en características ricas en información y utilizaremos algunas características listas para usar (denominadas incrustaciones) que se han vuelto cada vez más ubicuas en tareas que implican procesamiento del lenguaje natural (PLN).

Esto no quiere decir que las recetas aquí tratadas sean exhaustivas. Hay disciplinas académicas enteras que se centran en el tratamiento de datos no estructurados, como el texto. En este capítulo, cubriremos algunas técnicas de uso común; el conocimiento de éstas añadirá valiosas herramientas a nuestra caja de herramientas de preprocesamiento. Además de muchas recetas genéricas de procesamiento de texto, también demostraremos cómo puedes importar y aprovechar algunos modelos de aprendizaje automático preentrenados para generar características de texto más ricas.

6.1 Texto de limpieza

Problema

Tienes algunos datos de texto no estructurados de y quieres completar una limpieza básica.

Solución

En el siguiente ejemplo de , examinamos el texto de tres libros y lo limpiamos utilizando las operaciones de cadena básicas de Python, en concreto ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Visualización de Datos con Python y JavaScript, 2ª Edición

Visualización de Datos con Python y JavaScript, 2ª Edición

Kyran Dale
Arquitectura de Plataformas de Datos y Aprendizaje Automático

Arquitectura de Plataformas de Datos y Aprendizaje Automático

Marco Tranquillin, Valliappa Lakshmanan, Firat Tekiner
Análisis de Texto Aplicado con Python

Análisis de Texto Aplicado con Python

Benjamin Bengfort, Rebecca Bilbro, Tony Ojeda

Publisher Resources

ISBN: 9781098186814Supplemental Content