Kapitel 13. Fallstudie: Wahl der richtigen Datenstruktur

Häufigkeitsanalyse für Wörter

Wie üblich, sollten Sie mindestens eine der folgenden Übungen versuchen, bevor Sie meine Lösungen lesen.

Schreiben Sie ein Programm, das eine Datei einliest, jede Zeile in Wörter zerlegt, Whitespace und Interpunktionszeichen aus den Wörtern entfernt und sie in Kleinbuchstaben konvertiert.

Tipp: Das Modul string stellt zwei nützliche Zeichenfolgen zur Verfügung: whitespace – mit Leerzeichen, Tab, Zeilenvorschub usw. – sowie punctuation mit Interpunktionszeichen. Mal sehen, ob wir Python fluchen lassen können:

>>> import string
>>> print string.punctuation
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

Außerdem können Sie versuchen, die String-Methoden strip, replace und translate ...

Get Programmieren lernen mit Python now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.