Skip to Content
Introducción al Aprendizaje Automático con Python
book

Introducción al Aprendizaje Automático con Python

by Andreas C. Müller, Sarah Guido
September 2024
Intermediate to advanced
400 pages
11h 15m
Spanish
O'Reilly Media, Inc.
Content preview from Introducción al Aprendizaje Automático con Python

Capítulo 7. Trabajar con datos de texto

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

En el Capítulo 4, hablamos de dos tipos de características que pueden representar propiedades de los datos: características continuas que describen una cantidad, y características categóricas que son elementos de una lista fija. Hay un tercer tipo de característica que puede encontrarse en muchas aplicaciones, que es el texto. Por ejemplo, si queremos clasificar un mensaje de correo electrónico como correo legítimo o spam, el contenido del correo electrónico contendrá sin duda información importante para esta tarea de clasificación. O quizá queramos conocer la opinión de un político sobre el tema de la inmigración. En este caso, los discursos o tweets de ese individuo podrían proporcionar información útil. En el servicio de atención al cliente, a menudo queremos averiguar si un mensaje es una queja o una consulta. Podemos utilizar el asunto y el contenido de un mensaje para determinar automáticamente la intención del cliente, lo que nos permite enviar el mensaje al departamento adecuado, o incluso enviar una respuesta totalmente automática.

Los datos de texto suelen representarse como cadenas, formadas por caracteres. En cualquiera de los ejemplos que acabamos de dar, la longitud de los datos de texto variará. Esta característica es claramente muy diferente de las características numéricas que hemos analizado hasta ahora, ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Python de alto rendimiento, 2ª edición

Python de alto rendimiento, 2ª edición

Micha Gorelick, Ian Ozsvald

Publisher Resources

ISBN: 9781098181703