February 2008
Intermediate to advanced
400 pages
10h
German
Unsere eher flüchtige Beobachtung, dass die gewählte Variable nicht sehr gut sei, mag korrekt sein, aber um per Software auszuwählen, welche Variable die richtige ist, brauchen Sie eine Möglichkeit zu messen, wie gemischt ein Set ist. Denn Sie wollen ja die Variable finden, die dafür sorgt, dass die zwei Sets so wenig gemischt sind wie möglich. Die erste Funktion, die Sie benötigen, ist eine, die die Ergebnisse in jedem Set zählt. Fügen Sie diesen Code der Datei treepredict.py hinzu:
# Zählen der möglichen Ergebnisse (die letzte Spalte in jeder Zeile # ist das Ergebnis). def uniquecounts(rows): results={} for row in rows: # Das Ergebnis steht in der letzten Spalte. r=row[len(row)-1] if r not in results: results[r]=0 ...