Parte II. Datos distribuidos

Para que una tecnología tenga éxito, la realidad debe primar sobre las relaciones públicas, pues a la naturaleza no se la puede engañar.

Richard Feynman, Informe de la Comisión Rogers (1986)

En la Parte I de este libro, tratamos aspectos de los sistemas de datos que se aplican cuando los datos se almacenan en una sola máquina. Ahora, enla Parte II, subimos un nivel y nos preguntamos: ¿qué ocurre si intervienen varias máquinas en el almacenamiento y la recuperación de datos?

Hay varias razones por las que puedes querer distribuir una base de datos entre varias máquinas:

Escalabilidad

Si tu volumen de datos, carga de lectura o carga de escritura crece más de lo que puede manejar una sola máquina, puedes repartir potencialmente la carga entre varias máquinas.

Tolerancia a fallos/alta disponibilidad

Si tu aplicación necesita seguir funcionando aunque se caiga una máquina (o varias, o la red, o todo un centro de datos), puedes utilizar varias máquinas para tener redundancia. Cuando una falla, otra puede tomar el relevo.

Latencia

Si tienes usuarios en todo el mundo, puede que quieras tener servidores en varios lugares del mundo para que cada usuario pueda ser atendido desde un centro de datos que esté geográficamente cerca de él. Así evitas que los usuarios tengan que esperar a que los paquetes de red viajen por medio mundo.

Escalado a mayor carga

Si lo único que necesitas es escalar a una carga mayor, lo más sencillo es comprar una ...

Get Diseño de aplicaciones intensivas en datos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.