Capítulo 5. Acceder a los datos de la web

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Internet es una fuente increíble de datos; es, posiblemente, la razón por la que los datos se han convertido en una parte tan dominante de nuestras vidas sociales, económicas, políticas e incluso creativas. En el Capítulo 4, centramos nuestros esfuerzos de manipulación de datos en el proceso de acceso y reformateo de datos basados en archivos que ya se habían guardado en nuestros dispositivos o en la nube. Al mismo tiempo, muchos de ellos procedían originalmente de Internet, ya fueran descargados de un sitio web, como los datos del desempleo, o recuperados de una URL, como los datos de Citi Bike. Sin embargo, ahora que sabemos cómo utilizar Python para analizar y transformar diversos formatos de datos basados en archivos, ha llegado el momento de analizar qué implica la recopilación de esos archivos en primer lugar, especialmente cuando los datos que contienen son en tiempo real y se basan en fuentes. Para ello, vamos a dedicar la mayor parte de este capítulo a aprender cómo acceder a los datos disponibles a través de las API, esas interfaces de programación de aplicacionesque mencioné al principio del Capítulo 4. Las API son la principal (y a veces la única) forma de acceder a los datos generados por los servicios en tiempo real o a la carta, como las plataformas de redes sociales, la música en streaming y los servicios ...

Get Tramitación práctica de datos y calidad de datos en Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.