Capítulo 8. BigQuery y almacenamiento de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Con más empresas apoyándose en datos y análisis en tiempo real para impulsar las decisiones empresariales, las técnicas de almacenamiento de datos de son cada vez más críticas. Como almacén de datos sin servidor y a escala de petabytes de Google Cloud, BigQuery suele ser tu primera y última parada para el almacenamiento de datos, la analítica a gran escala e incluso los modelos de aprendizaje automático basados en SQL. Como servicio sin servidor, no hay que crear clusters. Sólo tienes que cargar tus datos en BigQuery y empezar a consultar.

BigQuery también es muy rentable, ya que el cálculo y el almacenamiento están separados y pueden escalarse por separado. Si nunca consultas tus datos, sólo se te cobran los costes de almacenamiento. Pero cuando realizas consultas, tienes acceso a una enorme cantidad de cálculo sin servidor para procesar tus datos rápidamente. Y sólo pagas por el cálculo utilizado cuando realizas consultas, en lugar de pagar por los trabajadores ociosos de un clúster.

Las siguientes recetas muestran ejemplos de implementación de carga de datos, consulta de datos escalables y streaming en BigQuery. Se incluyen consejos y trucos que van más allá de los conocimientos estándar de SQL, algunos de los cuales son específicos del servicio y la implementación de BigQuery. En varias recetas también se utilizará ...

Get Libro de cocina de Google Cloud now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.