Kapitel 13. Fallstudie: Die Wahl der richtigen Datenstruktur

Häufigkeitsanalyse für Wörter

Wie üblich, sollten Sie mindestens eine der folgenden Übungen versuchen, bevor Sie meine Lösungen lesen.

Übung 13-1:

Schreiben Sie ein Programm, das eine Datei einliest, jede Zeile in Wörter zerlegt, Whitespace und Interpunktionszeichen aus den Wörtern entfernt und sie in Kleinbuchstaben konvertiert.

Tipp: Das Modul string stellt zwei nützliche Zeichenfolgen zur Verfügung: whitespace – mit Leerzeichen, Tab, Zeilenvorschub usw. – sowie punctuation mit Interpunktionszeichen. Mal sehen, ob wir Python fluchen lassen können:

>>> import string
>>> print(string.punctuation)
!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

Außerdem können Sie versuchen, die String-Methoden strip

Get Programmieren lernen mit Python, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.