February 2008
Intermediate to advanced
400 pages
10h
German
Sie haben nun Zähler, die angeben, wie oft eine E-Mail in jeder Kategorie auftaucht, daher ist der nächste Schritt, diese Zahlen in Wahrscheinlichkeiten umzurechnen. Eine Wahrscheinlichkeit ist eine Zahl zwischen 0 und 1, die angibt, wie wahrscheinlich ein Ereignis ist. In diesem Fall können Sie die Wahrscheinlichkeit berechnen, dass sich ein Wort in einer bestimmten Kategorie befindet, indem Sie die Häufigkeit des Auftretens dieses Worts in einem Dokument in dieser Kategorie durch die Gesamtanzahl an Dokumenten in dieser Kategorie teilen.
Fügen Sie eine Methode namens fprob zur Klasse classifier hinzu:
def fprob(self,f,cat): if self.catcount(cat)==0: return 0 # Gesamthäufigkeit dieses Merkmals in dieser Kategorie, ...