Apéndice. Tipos de problemas de calidad de los datos
Este apéndice presenta información adicional sobre los tipos de problemas de calidad de los datos que suelen encontrarse en los datos del mundo real. Esta lista te resultará útil a la hora de evaluar la solución de monitoreo de la calidad de los datos que estás creando o comprando. En última instancia, querrás tener una estrategia para identificar y abordar cada uno de estos tipos de problemas para cada conjunto de datos importante de tu organización.
Para cada uno de estos problemas de calidad de los datos, proporcionaremos un ejemplo, un resumen de las causas comunes, una evaluación de cómo estos problemas suelen afectar a la analítica (uso de datos y seres humanos para fundamentar las decisiones) y al aprendizaje automático (uso de datos y algoritmos para automatizar procesos), y nuestras recomendaciones sobre la mejor forma de monitorear una fuente de datos para detectar estos problemas.
Como muestra la Figura A-1, hemos organizado los problemas de este apéndice en cuatro grandes categorías que indican a qué nivel afectan los problemas a los datos.
Temas de la mesa
Problemas que afectan a la totalidad de la tabla, y no son específicos de filas o valores individuales:
- Llegada tardía
-
Cuando los datos llegan tarde y no están disponibles ...
Get Automatizar la supervisión de la calidad de los datos now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.