Capítulo 3. Diseñar una buena arquitectura de datos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Una buena arquitectura de datos proporciona capacidades sin fisuras en cada paso del ciclo de vida de los datos y de la corriente subterránea. Empezaremos definiendo la arquitectura de datos y luego hablaremos de sus componentes y consideraciones. A continuación, abordaremos patrones específicos de batch (almacenes de datos, lagos de datos), patrones de streaming y patrones que unifican batch y streaming. En todo momento, haremos hincapié en aprovechar las capacidades de la nube para ofrecer escalabilidad, disponibilidad y fiabilidad.
¿Qué es la arquitectura de datos?
El éxito de la ingeniería de datos de se basa en una arquitectura de datos sólida como una roca. El objetivo de este capítulo es repasar algunos enfoques y marcos de arquitectura populares y, a continuación, elaborar nuestra propia definición de lo que constituye una "buena" arquitectura de datos. Ciertamente, no contentaremos a todo el mundo. Aun así, expondremos una definición pragmática, específica de cada dominio y de trabajo para la arquitectura de datos, que creemos que funcionará para empresas de escalas, procesos empresariales y necesidades muy diferentes.
¿Qué es la arquitectura de datos? Cuando te paras a desentrañarlo, el tema se vuelve un poco turbio; investigar sobre la arquitectura de datos arroja muchas definiciones incoherentes y ...
Get Fundamentos de la Ingeniería de Datos now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.