Capítulo 10. Alertas prácticas a partir de datos de series temporales

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Que las consultas fluyan y el busca permanezca en silencio.

Bendición tradicional de la ESR

El monitoreo, la capa inferior de la Jerarquía de Necesidades de Producción, es fundamental para que funcione un servicio estable. El monitoreo permite a los propietarios del servicio tomar decisiones racionales sobre el impacto de los cambios en el servicio, aplicar el método científico a la respuesta a incidentes y, por supuesto, garantizar su razón de ser: medir la alineación del servicio con los objetivos empresariales (ver Capítulo 6).

Independientemente de que un servicio cuente o no con el apoyo de un SRE, debe funcionar en una relación simbiótica con su monitoreo. Pero al haber sido encargados de la responsabilidad última de Google Production, los SRE desarrollan un conocimiento particularmente íntimo de la infraestructura de monitoreo que soporta su servicio.

Monitorear un sistema muy grande es un reto por un par de razones:

  • El gran número de componentes analizados

  • La necesidad de mantener una carga de mantenimiento razonablemente baja para los ingenieros responsables del sistema.

Los sistemas de monitoreo de Google no sólo miden métricas sencillas, como el tiempo medio de respuesta de un servidor web europeo sin cola; también necesitamos ...

Get Ingeniería de Fiabilidad del Sitio now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.