Kapitel 13. Fallstudie: Wahl der richtigen Datenstruktur

Häufigkeitsanalyse für Wörter

Wie üblich, sollten Sie mindestens eine der folgenden Übungen versuchen, bevor Sie meine Lösungen lesen.

Schreiben Sie ein Programm, das eine Datei einliest, jede Zeile in Wörter zerlegt, Whitespace und Interpunktionszeichen aus den Wörtern entfernt und sie in Kleinbuchstaben konvertiert.

Tipp: Das Modul string stellt zwei nützliche Zeichenfolgen zur Verfügung: whitespace – mit Leerzeichen, Tab, Zeilenvorschub usw. – sowie punctuation mit Interpunktionszeichen. Mal sehen, ob wir Python fluchen lassen können:

>>> import string
>>> print string.punctuation
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

Außerdem können Sie versuchen, die String-Methoden strip, replace und translate ...

Get Programmieren lernen mit Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.