Kapitel 13. Fallstudie: Wahl der richtigen Datenstruktur
Häufigkeitsanalyse für Wörter
Wie üblich, sollten Sie mindestens eine der folgenden Übungen versuchen, bevor Sie meine Lösungen lesen.
Schreiben Sie ein Programm, das eine Datei einliest, jede Zeile in Wörter zerlegt, Whitespace und Interpunktionszeichen aus den Wörtern entfernt und sie in Kleinbuchstaben konvertiert.
Tipp: Das Modul string
stellt zwei nützliche Zeichenfolgen zur Verfügung: whitespace
– mit Leerzeichen, Tab, Zeilenvorschub usw. – sowie punctuation
mit Interpunktionszeichen. Mal sehen, ob wir Python fluchen lassen können:
>>> import string >>> print string.punctuation !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
Außerdem können Sie versuchen, die String-Methoden strip
, replace
und translate ...
Get Programmieren lernen mit Python now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.