February 2008
Intermediate to advanced
400 pages
10h
German
Tanimoto Score. Finden Sie heraus, was der Tanimoto Similarity Score ist. In welchen Fällen kann dieser Score als Ähnlichkeitsmetrik anstatt des euklidischen Abstands oder des Pearson-Korrelationskoeffizienten genutzt werden? Erstellen Sie eine neue Ähnlichkeitsfunktion, die den Tanimoto Score nutzt.
Tag-Ähnlichkeit. Erstellen Sie eine Datenmenge mit Tags und Elementen mithilfe der del.icio.us-API. Nutzen Sie diese, um die Ähnlichkeit zwischen Tags zu bestimmen, und versuchen Sie herauszufinden, ob es nahezu identische gibt. Finden Sie ein paar Elemente, die mit »programming« getaggt werden könnten, es aber nicht sind.
Benutzerbasierte Effizienz. Der benutzerbasierte Filteralgorithmus ist ineffizient, weil er einen Benutzer jedes Mal mit ...