Wahrscheinlichkeiten berechnen
Sie haben nun Zähler, die angeben, wie oft eine E-Mail in jeder Kategorie auftaucht, daher ist der nächste Schritt, diese Zahlen in Wahrscheinlichkeiten umzurechnen. Eine Wahrscheinlichkeit ist eine Zahl zwischen 0 und 1, die angibt, wie wahrscheinlich ein Ereignis ist. In diesem Fall können Sie die Wahrscheinlichkeit berechnen, dass sich ein Wort in einer bestimmten Kategorie befindet, indem Sie die Häufigkeit des Auftretens dieses Worts in einem Dokument in dieser Kategorie durch die Gesamtanzahl an Dokumenten in dieser Kategorie teilen.
Fügen Sie eine Methode namens fprob
zur Klasse classifier
hinzu:
def fprob(self,f,cat): if self.catcount(cat)==0: return 0 # Gesamthäufigkeit dieses Merkmals in dieser Kategorie, ...
Get Kollektive Intelligenz analysieren, programmieren und nutzen now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.