CHAPITRE 4 Représentation des données et ingénierie des caractéristiques
Jusqu’ici, nous avons supposé que nos données se présentaient sous la forme d’un tableau en deux dimensions de nombres en virgule flottante, dans lequel chaque colonne est une caractéristique continue décrivant les points de données. Mais, pour de multiples applications, ce n’est pas ainsi que les données sont collectées. Certaines caractéristiques particulières sont dites catégorielles, ou encore discrètes. Il ne s’agit d’ailleurs généralement pas de valeurs numériques. La distinction entre caractéristiques catégorielles et caractéristiques continues est analogue à ce qui se passe pour la classification et la régression, du moins du côté des données d’entrée. Comme exemples ...
Get Le Machine learning avec Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.