Capítulo 3. Configuración de tus modelos de datose ingesta de datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Ahora que ya has configurado tu almacén de datos de Amazon Redshift, vamos a considerar una estrategia de administración de datos.

En este capítulo, discutiremos algunas opciones para tu estrategia de gestión de datos y si deberías emplear una "Estrategia de lago de datos primero frente a una estrategia de almacén de datos primero". A continuación, nos adentraremos en la "Definición de tu modelo de datos" y utilizaremos el "Conjunto de datos de análisis de aprendizaje de información de estudiantes" para ilustrar cómo crear tablas y "Cargar datos por lotes en Amazon Redshift" utilizando una muestra de estos datos en Amazon S3. Sin embargo, en el mundo actual, donde la velocidad de obtención de información es fundamental para mantener tu perímetro competitivo, también te mostraremos cómo "Cargar datos en tiempo real y casi en tiempo real". Por último, veremos cómo puedes "Optimizar tus estructuras de datos".

Estrategia "Primero el lago de datos" frente a "Primero el almacén de datos

En la era digital actual, las organizaciones son recogen y generan constantemente grandes cantidades de datos. Estos datos pueden proceder de diversas fuentes, como las interacciones de los usuarios, las lecturas de los sensores y la actividad en las redes sociales. Gestionar estos datos de forma eficaz es crucial para ...

Get Amazon Redshift: La Guía Definitiva now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.