February 2008
Intermediate to advanced
400 pages
10h
German
In allen bisherigen Beispielen nutzt die Funktion zum Erstellen einer Liste der erkmale eine einfache Teilung bei Zeichen, die keine Buchstaben sind, um die Wörter aufzuteilen. Die Funktion wandelt alle Wörter in Kleinbuchstaben um, daher gibt es keine Möglichkeit, die exzessive Verwendung von Großbuchstaben zu erkennen. Es gibt viele Möglichkeiten, dies zu verbessern:
Ohne Token in Groß- und Kleinbuchstaben tatsächlich als unterschiedliche Merkmale anzusehen, können Sie die Häufigkeit vieler Wörter in Großbuchstaben trotzdem als Merkmal verwenden.
Nutzen Sie neben den einzelnen Wörtern Kombinationen von Wörtern.
Nehmen Sie Rücksicht auf weitere Metainformationen, zum Beispiel wer eine E-Mail verschickt hat oder in welcher ...