Book description
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Las empresas del mundo ingieren cada día un total de 2,5 quintillones de bytes de datos. Pero, ¿cuántos de estos datos -utilizados para crear productos, alimentar sistemas de IA e impulsar decisiones empresariales- son de mala calidad o simplemente malos? Este práctico libro te muestra cómo garantizar que los datos en los que confía tu organización sólo contengan registros de alta calidad.
La mayoría de los ingenieros de datos, analistas de datos y científicos de datos se preocupan realmente por la calidad de los datos, pero a menudo no disponen del tiempo, los recursos o los conocimientos necesarios para crear una solución de supervisión de la calidad de los datos que tenga éxito a escala. En este libro, Jeremy Stanley y Paige Schwartz, de Anomalo, explican cómo puedes utilizar la supervisión automatizada de la calidad de los datos para cubrir todas tus tablas de forma eficaz, alertar proactivamente sobre todas las categorías de problemas y resolverlos de inmediato.
Este libro te ayudará:
- Saber por qué la calidad de los datos es un imperativo empresarial
- Comprender y evaluar los modelos de aprendizaje no supervisado para detectar problemas en los datos
- Implementar notificaciones que reduzcan la fatiga de las alertas y te permitan clasificar y resolver los problemas rápidamente
- Integrar la supervisión automatizada de la calidad de los datos con catálogos de datos, capas de orquestación y sistemas de BI y ML.
- Comprende los límites de la supervisión automatizada de la calidad de los datos y cómo superarlos
- Aprende a desplegar y gestionar tu solución de supervisión a escala
- Mantén la supervisión automatizada de la calidad de los datos a largo plazo
Table of contents
- Prólogo
- Prefacio
- 1. El imperativo de la calidad de los datos
-
2. Estrategias de monitoreo de la calidad de los datos y papel de la automatización
- Requisitos de monitoreo
- Observabilidad de los Datos: Necesaria, pero no suficiente
- Enfoques tradicionales de la calidad de los datos
- Automatizar el monitoreo de la calidad de los datos con aprendizaje automático no supervisado
- Un enfoque de cuatro pilares para el monitoreo de la calidad de los datos
- 3. Evaluación del impacto empresarial del monitoreo automatizado de la calidad de los datos
- 4. Automatizar el monitoreo de la calidad de los datos con aprendizaje automático
- 5. Construir un modelo que funcione con datos reales
- 6. Implementar las notificaciones evitando la fatiga de las alertas
- 7. Integrar el monitoreo con herramientas y sistemas de datos
- 8. Poner en marcha tu solución a escala
- Apéndice. Tipos de problemas de calidad de los datos
- Índice
- Sobre los autores
Product information
- Title: Automatizar la supervisión de la calidad de los datos
- Author(s):
- Release date: September 2024
- Publisher(s): O'Reilly Media, Inc.
- ISBN: 9781098196936
You might also like
article
Reinventing the Organization for GenAI and LLMs
Previous technology breakthroughs did not upend organizational structure, but generative AI and LLMs will. We now …
article
Splitting Strings on Any of Multiple Delimiters
Build your knowledge of Python with this Shortcuts collection. Focusing on common problems involving text manipulation, …
article
Use Github Copilot for Prompt Engineering
Using GitHub Copilot can feel like magic. The tool automatically fills out entire blocks of code--but …
article
Three Ways to Sell Value in B2B Markets
As customers face pressure to reduce costs while maintaining profitability, value-based selling (VBS) has become critical …