Parte II. Plataforma

En la Parte I, cubrimos los aspectos esenciales de la creación de una infraestructura física y organizativa eficiente y resistente para tus clústeres. Sobre esta sólida base, ahora podemos construir plataformas de software distribuido completas que puedan hacer frente a los rigores del almacenamiento y procesamiento de datos a gran escala inherentes a los requisitos y casos de uso de las grandes empresas.

En los capítulos siguientes, exploramos los aspectos arquitectónicos de las plataformas de datos modernas, desde el sistema operativo básico y el software de apoyo hasta el aprovisionamiento de Hadoop y otros sistemas distribuidos. Las organizaciones exigen que estas plataformas encajen en un ecosistema preexistente de usuarios y aplicaciones, y los estándares empresariales exigen que las implementaciones cumplan determinadas normas de seguridad, disponibilidad y recuperación ante desastres. Cubrimos estas preocupaciones en detalle.

Al final de esta sección, esperamos que el lector -ya sea arquitecto, desarrollador de aplicaciones u operador de clústeres- se sienta seguro de cómo y, sobre todo, de por qué se crean los clústeres. Esta comprensión será de inmenso valor a la hora de construir y poner en funcionamiento nuevos clústeres y de diseñar y ejecutar aplicaciones que trabajen en sintonía con las plataformas de datos empresariales distribuidas.

Get Arquitectura de plataformas de datos modernas now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.