Capítulo 8. Fiabilidad

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Todo falla, todo el tiempo.

Werner Vogels, Director Técnico de Amazon Web Services

En los sistemas de software, siempre hay algo que puede ir mal. Quizá se llene un grupo de conexiones de base de datos, quizá haya una latencia inesperada debida a problemas de red, o quizá haya una mala implementación y un servicio empiece a responder con 500s. La probabilidad de encontrar fallos es aún mayor en las infraestructuras de microservicios, porque una sola solicitud puede implicar a varios servicios. Por ejemplo, cada servicio puede tener un tiempo de actividad del 99,9%, pero si hay cinco servicios implicados en cada solicitud, tu tiempo de actividad en conjunto será sólo del 99,5%.1 Puede que no parezca una gran diferencia, ¡pero en realidad supone un aumento de 8 horas de inactividad al año a 43!

Simplemente no es posible evitar los fallos en todos tus sistemas. Hay demasiados componentes implicados, la complejidad es demasiado alta y no puedes invertir mucho en fiabilidad sin restar tiempo a las funciones orientadas al usuario y a otras necesidades de la empresa. Dado que el fallo es inevitable, lo mejor que puedes hacer es diseñar tus sistemas para que lo gestionen con elegancia. Manejar el fallo con elegancia significa reducir el impacto del fallo tanto como sea posible.

Consul puede ayudar a reducir el impacto de los fallos mediante sus ...

Get Consulta: En marcha now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.