February 2008
Intermediate to advanced
400 pages
10h
German
Dies ist einer der am einfachsten zu erstellenden Klassifizierer, aber eine gute Grundlage für die weitere Arbeit. Er ermittelt den Durchschnitt aller Daten in jeder Klasse und legt einen Punkt fest, der den Mittelpunkt dieser Klasse definiert. Dann kann er neue Punkte klassifizieren, indem er ermittelt, welchem Mittelpunkt sie am nächsten sind.
Dazu benötigen Sie zunächst eine Funktion, die den Mittelpunkt jeder Klasse errechnet. In diesem Fall sind die Klassen nur 0 und 1. Fügen Sie lineartrain advancedclassify.py hinzu:
def lineartrain(rows): averages={} counts={} for row in rows: # Klasse dieses Punkts ermitteln. cl=row.match averages.setdefault(cl,[0.0]*(len(row.data))) counts.setdefault(cl,0) # Diesen Punkt ...