Teil II. Fortgeschrittenes Scraping
Du hast die Grundlagen für das Web Scrapen gelegt, jetzt kommt der spaßige Teil. Bis zu diesem Punkt waren deine Web Scraper relativ dumm. Sie sind nicht in der Lage, Informationen abzurufen, wenn sie ihnen nicht sofort in einem schönen Format vom Server präsentiert werden. Sie nehmen alle Informationen für bare Münze und speichern sie ohne jede Analyse. Formulare, Website-Interaktionen und sogar JavaScript machen ihnen einen Strich durch die Rechnung. Kurz gesagt, sie sind nicht in der Lage, Informationen abzurufen, es sei denn, diese Informationen wollen wirklich abgerufen werden.
Dieser Teil des Buches hilft dir, Rohdaten zu analysieren, um die Geschichte hinter den Daten zu verstehen - die Geschichte, die Websites oft unter Schichten von JavaScript, Anmeldeformularen und Anti-Scraping-Maßnahmen verbergen. Du lernst, wie du Web Scraper einsetzen kannst, um deine Websites zu testen, Prozesse zu automatisieren und in großem Maßstab auf das Internet zuzugreifen. Am Ende dieses Abschnitts wirst du über die Werkzeuge verfügen, mit denen du fast jede Art von Daten in jeder Form und in jedem Teil des Internets sammeln und manipulieren kannst.
Get Web Scraping mit Python, 2. Auflage now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.