Capítulo 3. El Almacenamiento: El corazón de la casa del lago

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

La capa de almacenamiento es el corazón de cualquier plataforma de datos. En las plataformas basadas en la arquitectura lakehouse, desempeña un papel importante en la persistencia eficiente de todo tipo de datos y en la mejora del rendimiento de las consultas. La capa de almacenamiento lakehouse consta de almacenamiento en la nube, formatos de archivo y formatos de tabla. En este capítulo, nos centraremos en comprender estos conceptos y las tecnologías disponibles para implementar la capa de almacenamiento lakehouse.

Explicaré los conceptos fundamentales relacionados con el almacenamiento en lagos, la diferencia entre los almacenes en filas y en columnas, y cómo el almacenamiento está estrechamente relacionado con el rendimiento. A continuación, profundizaremos en los formatos de archivo utilizados para almacenar datos para casos de uso analítico, las ventajas de utilizar cada formato y las características clave que debes tener en cuenta al crear una plataforma de datos.

Una vez que comprendas estos conceptos, te resultará más fácil tratar el tema central de este capítulo: los formatos de tabla abiertos. Hablaremos de los principales formatos de tabla, de sus características y ventajas, y de las limitaciones específicas que debes tener en cuenta al tomar cualquier decisión de diseño.

En la última sección ...

Get Arquitectura práctica de casas en el lago now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.