Skip to Content
Systèmes de production à apprentissage automatique
book

Systèmes de production à apprentissage automatique

by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
March 2025
Intermediate to advanced
474 pages
15h 29m
French
O'Reilly Media, Inc.
Audio summary available
Content preview from Systèmes de production à apprentissage automatique

Chapitre 5. Étiquetage avancé, augmentation et prétraitement des données

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

Les sujets abordés dans ce chapitre sont particulièrement importants pour façonner tes données afin d'en tirer le maximum de valeur pour ton modèle, surtout dans un contexte d'apprentissage supervisé. L'étiquetage en particulier peut facilement être l'une des activités les plus coûteuses et les plus chronophages dans la création, la maintenance et l'évolution d'une application de ML. Une bonne compréhension des options disponibles t'aidera à tirer le meilleur parti de tes ressources et de ton budget.

À cette fin, dans ce chapitre, nous discuterons de l'augmentation des données, une classe de méthodes dans lesquelles tu ajoutes plus de données à ton ensemble de données d'entraînement afin d'améliorer l'entraînement, généralement pour améliorer la généralisation en particulier. L'augmentation des données est presque toujours basée sur la manipulation de tes données actuelles pour créer de nouvelles variations, mais toujours valides, de tes exemples.

Nous aborderons également le prétraitement des données, mais dans ce chapitre, nous nous concentrerons sur le prétraitement spécifique à un domaine. Différents domaines, tels que les séries temporelles, le texte et les images, ont des formes spécialisées d'ingénierie des caractéristiques. Nous avons abordé l'une d'entre elles, la tokenisation ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Nerds on Wall Street: Math, Machines, and Wired Markets

Nerds on Wall Street: Math, Machines, and Wired Markets

David J. Leinweber, Theodore R. Aronson
生成AIの可視化

生成AIの可視化

Priyanka Vergadia, Valliappa Lakshmanan

Publisher Resources

ISBN: 9798341631076