Capítulo 22. Afrontar los fallos en cascada
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Si al principio no lo consigues, retrocede exponencialmente.
Dan Sandler, ingeniero de software de Google
¿Por qué la gente siempre olvida que hay que añadir un poco de fluctuación?
Ade Oshineye, Defensor del Desarrollador de Google
Un fallo en cascada es un fallo que crece con el tiempo como resultado de una retroalimentación positiva.1 Puede ocurrir cuando falla una parte de un sistema global, aumentando la probabilidad de que fallen otras partes del sistema. Por ejemplo, una única réplica de un servicio puede fallar por sobrecarga, aumentando la carga en las réplicas restantes y aumentando su probabilidad de fallar, provocando un efecto dominó que derriba todas las réplicas de un servicio.
Utilizaremos el servicio de búsqueda de Shakespeare comentado en"Shakespeare: Un servicio de ejemplo" como ejemplo a lo largo de este capítulo. Su configuración de producción podría parecerse ala Figura 22-1.
Causas de los fallos en cascada y diseño para evitarlos
Un diseño bien pensado del sistema debe tener en cuenta algunos escenarios típicos que representan la mayoría de los fallos en cascada.
Sobrecarga del ...
Get Ingeniería de Fiabilidad del Sitio now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.