Capítulo 2. Una infraestructura de datos moderna

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Antes de decidir sobre los productos y el diseño para construir pipelines, merece la pena comprender qué compone una pila de datos moderna. Como ocurre con la mayoría de las cosas en tecnología, no hay una única forma correcta de diseñar tu ecosistema analítico o elegir productos y proveedores. En cualquier caso, hay algunas necesidades y conceptos clave que se han convertido en estándar del sector y sientan las bases para las buenas prácticas en la implementación de canalizaciones.

Echemos un vistazo a los componentes clave de una infraestructura de este tipo, como se muestra en la Figura 2-1. Los próximos capítulos explorarán cómo cada componente influye en el diseño y la implementación de los conductos de datos.

Diversidad de fuentes de datos

La mayoría de las organizaciones tienen docenas, si no cientos, de fuentes de datos que alimentan sus esfuerzos analíticos. Las fuentes de datos varían en muchas de las dimensiones tratadas en esta sección.

dppr 0201
Figura 2-1. Los componentes clave de una infraestructura de datos moderna.

Propiedad del sistema fuente

Es habitual que un equipo de análisis ingiera datos de sistemas fuente creados y propiedad de la organización, así como de herramientas y proveedores de terceros. ...

Get Referencia de bolsillo sobre canalizaciones de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.