Kapitel 13. Fallstudie: Die Wahl der richtigen Datenstruktur
Häufigkeitsanalyse für Wörter
Wie üblich, sollten Sie mindestens eine der folgenden Übungen versuchen, bevor Sie meine Lösungen lesen.
Übung 13-1:
Schreiben Sie ein Programm, das eine Datei einliest, jede Zeile in Wörter zerlegt, Whitespace und Interpunktionszeichen aus den Wörtern entfernt und sie in Kleinbuchstaben konvertiert.
Tipp: Das Modul string
stellt zwei nützliche
Zeichenfolgen zur Verfügung: whitespace
– mit
Leerzeichen, Tab, Zeilenvorschub usw. – sowie punctuation
mit Interpunktionszeichen. Mal sehen, ob wir Python fluchen lassen können:
>>> import string >>> print(string.punctuation) !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
Außerdem können Sie versuchen, die String-Methoden
strip
Get Programmieren lernen mit Python, 2nd Edition now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.