Capítulo 9. Almacenes de características

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Como ya hemos dicho, el proceso ETL extrae datos de los almacenes de datos operativos (que alimentan las aplicaciones que sirven a la empresa) y los introduce en el plano de datos analíticos. El plano analítico se utiliza para crear modelos estadísticos que aportan información, que la empresa utiliza para tomar decisiones críticas. Estas decisiones se retroalimentan al plano operativo para mejorar y optimizar el rendimiento y, en última instancia, aumentar los ingresos. Uno de los principios de un producto de datos en una malla de datos es proporcionar datos de alta calidad y fiables a los equipos analíticos. La calidad y la fiabilidad ayudan a generar confianza en los resultados analíticos.

Las características, o columnas, son fragmentos de datos medibles, como la altura, la anchura, la edad, el peso, la cantidad y el precio, que pueden utilizarse para el análisis. La ingeniería de características es el proceso de extraer y preparar datos para el procesamiento analítico y almacenarlos en un almacén de características. El almacén de características sirve datos analíticos preparados a los científicos de datos. Antes de la llegada de los almacenes de características, los científicos de datos y los ingenieros trabajaban juntos con un enfoque muy desorientado y desorganizado a la hora de crear perspectivas. A menudo, los datos ...

Get Malla de transmisión de datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.