Systèmes de production à apprentissage automatique
by Robert Crowe, Hannes Hapke, Emily Caveness, Di Zhu
Chapitre 3. Ingénierie et sélection des caractéristiques
Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com
L'ingénierie des caractéristiques et la sélection des caractéristiques sont au cœur du prétraitement des données pour la ML, en particulier pour l'entraînement des modèles. L'ingénierie des caractéristiques est également nécessaire lors de l'inférence, et il est essentiel que le prétraitement effectué lors de l'inférence corresponde au prétraitement effectué lors de la formation.
Une partie du contenu de ce chapitre peut ressembler à une révision, surtout si tu as travaillé en ML dans un contexte de non-production, par exemple dans un cadre universitaire ou de recherche. Mais nous nous concentrerons sur les questions de production dans ce chapitre. L'une des principales questions que nous aborderons est de savoir comment effectuer de l'ingénierie des fonctionnalités à grande échelle de manière reproductible et cohérente.
Nous discuterons également de la sélection des caractéristiques et de son importance dans un contexte de production. Souvent, tu auras plus de caractéristiques que tu n'en as réellement besoin pour ton modèle, et ton objectif devrait être d'inclure uniquement les caractéristiques qui offrent le plus d'informations prédictives pour le problème que tu essaies de résoudre. En inclure plus que cela augmente les coûts et la complexité et peut contribuer à des problèmes de qualité ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access