Skip to Content
Pense à Bayes, 2e édition
book

Pense à Bayes, 2e édition

by Allen B. Downey
November 2024
Intermediate to advanced
338 pages
7h 57m
French
O'Reilly Media, Inc.
Content preview from Pense à Bayes, 2e édition

Chapitre 12. La classification

Cet ouvrage a été traduit à l'aide de l'IA. Tes réactions et tes commentaires sont les bienvenus : translation-feedback@oreilly.com

La classification est peut-être l'application la plus connue des méthodes bayésiennes, rendues célèbres dans les années 1990 en tant que base de la première génération de filtres anti-spam.

Dans ce chapitre, je vais faire une démonstration de classification bayésienne à l'aide de données recueillies et mises à disposition par le Dr Kristen Gorman à la station de recherche écologique à long terme Palmer en Antarctique (voir Gorman, Williams et Fraser, " Ecological Sexual Dimorphism and Environmental Variability within a Community of Antarctic Penguins (Genus Pygoscelis) ", mars 2014). Nous utiliserons ces données pour classer les pingouins par espèce.

Données sur les pingouins

J'utiliserai pandas pour charger les données dans une page DataFrame:

import pandas as pd

df = pd.read_csv('penguins_raw.csv')
df.shape
(344, 17)

L'ensemble de données contient une ligne pour chaque pingouin et une colonne pour chaque variable.

Trois espèces de manchots sont représentées dans l'ensemble de données : Adélie, Chinstrap et Gentoo.

Les mesures que nous utiliserons sont les suivantes :

  • Masse corporelle en grammes (g).

  • Longueur des palmes en millimètres (mm).

  • Longueur du culmen en millimètres.

  • Profondeur du culmen en millimètres.

Si tu ne connais pas le mot "culmen", il désigne lamarge supérieure du bec.

Ces mesures seront plus ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Think Stats, 2nd Edition

Think Stats, 2nd Edition

Allen B. Downey
Computational Statistics, 2nd Edition

Computational Statistics, 2nd Edition

Geof H. Givens, Jennifer A. Hoeting
Mathematics for Physicists

Mathematics for Physicists

Brian R. Martin, Graham Shaw
Bayesian Data Analysis, Third Edition, 3rd Edition

Bayesian Data Analysis, Third Edition, 3rd Edition

Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari, Donald B. Rubin

Publisher Resources

ISBN: 9798341617339