Teil I. Gebäudeabstreifer

Im ersten Teil dieses Buches geht es um die grundlegenden Mechanismen des Web Scraping: wie man mit Python Informationen von einem Webserver anfordert, wie man die Antworten des Servers verarbeitet und wie man mit einer Website auf automatisierte Weise interagiert. Am Ende wirst du mit Leichtigkeit im Internet unterwegs sein und Scraper erstellen, die von einer Domain zur anderen springen, Informationen sammeln und diese für die spätere Verwendung speichern können.

Um ehrlich zu sein, ist Web Scraping ein fantastischer Einstieg, wenn du mit relativ wenig Aufwand viel Geld verdienen willst. Wahrscheinlich werden 90 % aller Web-Scraping-Projekte, mit denen du konfrontiert wirst, auf den Techniken basieren, die in den nächsten sechs Kapiteln beschrieben werden. In diesem Abschnitt geht es darum, woran die allgemeine (wenn auch technisch versierte) Öffentlichkeit denkt, wenn sie an "Web Scraper" denkt:

  • Abrufen von HTML-Daten von einem Domainnamen

  • Analysieren dieser Daten für Zielinformationen

  • Speichern der Zielinformationen

  • Optional kannst du zu einer anderen Seite wechseln, um den Vorgang zu wiederholen.

So erhältst du eine solide Grundlage, bevor du in Teil II zu komplexeren Projekten übergehst. Lass dich nicht davon täuschen, dass dieser erste Teil nicht so wichtig ist wie einige der fortgeschritteneren Projekte in der zweiten Hälfte. Du wirst fast alle Informationen aus der ersten Hälfte dieses Buches täglich beim Schreiben von Web Scrapern verwenden! ...

Get Web Scraping mit Python, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.