Rozdział 48. Dogłębne spojrzenie — modele mieszanin rozkładów Gaussa

Model klasteryzacji za pomocą algorytmu k-średnich omówiony w poprzednim rozdziale jest prosty i stosunkowo łatwy do zrozumienia. Jednak z prostotą tą wiążą się praktyczne wyzwania podczas jego stosowania. W szczególności nieprobabilistyczny charakter algorytmu k-średnich i etykietowanie na podstawie prostej odległości od środka klastra prowadzi do słabej wydajności w wielu praktycznych zastosowaniach. W tym rozdziale przyjrzymy się modelom mieszanin rozkładów Gaussa, które można postrzegać jako rozszerzenie koncepcji kryjących się za algorytmem k-średnich. Poza klasteryzacją modele te to również potężne narzędzie estymacji.

Zaczynamy od standardowych importów:

In [1]: %matplotlib ...

Get Python Data Science now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.