Capítulo 2. Calidad de los datos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Dediqué el 80% de mi tiempo a limpiar los datos. Unos datos mejores siempre vencerán a unos modelos mejores.

Thomson Nguyen

Datos es la base de una organización basada en datos.

Si no dispones de datos oportunos, relevantes y fiables, los responsables de la toma de decisiones no tienen otra alternativa que tomar decisiones por instinto. La calidad de los datos es clave.

Nota

En este capítulo, utilizo "calidad" en un sentido muy amplio, considerándola principalmente desde la perspectiva de un analista.

Los analistas necesitan los datos correctos, recogidos de la manera correcta, en la forma correcta, en el lugar correcto y en el momento correcto. (Si falta alguno de estos aspectos, los analistas verán limitadas las preguntas a las que pueden responder y el tipo o la calidad de los conocimientos que pueden obtener de los datos.

En este capítulo y en el siguiente, trataré este amplio tema de la calidad de los datos de . En primer lugar, hablaré de cómo garantizar que el proceso de recopilación de datos es correcto. Se trata de calidad en el sentido de que sea preciso, puntual, coherente, etc. Después, en el siguiente capítulo, trataré cómo asegurarnos de que estamos recopilando los datos correctos. Esto es calidad en el sentido de elegir y suministrar las mejores fuentes de datos para aumentar los datos existentes y permitir así ...

Get Crear una organización basada en datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.