Skip to Content
Introducción al Aprendizaje Automático con Python
book

Introducción al Aprendizaje Automático con Python

by Andreas C. Müller, Sarah Guido
September 2024
Intermediate to advanced
400 pages
11h 15m
Spanish
O'Reilly Media, Inc.
Content preview from Introducción al Aprendizaje Automático con Python

Capítulo 6. Cadenas y tuberías de algoritmos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Para muchos algoritmos de aprendizaje automático, la representación concreta de los datos que proporciones es muy importante, como vimos en el Capítulo 4. Esto comienza con el escalado de los datos y la combinación de características a mano, y llega hasta el aprendizaje de características mediante aprendizaje automático no supervisado, como vimos en el Capítulo 3. En consecuencia, la mayoría de las aplicaciones de aprendizaje automático requieren no sólo la aplicación de un único algoritmo, sino el encadenamiento de muchos pasos de procesamiento y modelos de aprendizaje automático diferentes. En este capítulo veremos cómo utilizar la clase Pipelinepara simplificar el proceso de construcción de cadenas de transformaciones y modelos. En concreto, veremos cómo podemos combinar Pipeline yGridSearchCV para buscar sobre los parámetros de todos los pasos de procesamiento a la vez.

Como ejemplo de la importancia de encadenar modelos, hemos observado que podemos mejorar mucho el rendimiento de una SVM de núcleo en el conjunto de datos cancerutilizando el MinMaxScaler para el preprocesamiento. Aquí tienes el código para dividir los datos, calcular el mínimo y el máximo, escalar los datos y entrenar la SVM:

In[1]:

from sklearn.svm import SVC
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import 
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Piensa en Python, 3ª Edición

Piensa en Python, 3ª Edición

Allen B. Downey
Python de alto rendimiento, 2ª edición

Python de alto rendimiento, 2ª edición

Micha Gorelick, Ian Ozsvald

Publisher Resources

ISBN: 9781098181703