Clúster de servidores Linux para alta disponibilidad de la informacion.
Resumen
La investigación realizada tiene como objetivo implementar y diseñar un clúster de servidores en entorno Linux para brindar un servicio de alta disponibilidad de la información, para tal propósito se utilizaron herramientas como la base de datos postgreSQL, Pppool 11, Heartbeat. La investigación tiene como caso de estudios la empresa MINE SENSE SOLUTIONS que implementará un sistema de control de flotas pesadas para el proyecto minero Hudbay-Constancia en la región del Cusco. La empresa en cuestión tiene la necesidad de alta disponibilidad del servicio de información para el sistema que implementará por ser de vital importancia en las operaciones diarias. Para el diseño e implementación del clúster de alta disponibilidad se investigó las herramientas disponibles y que mejor se adaptan a las necesidades antes mencionadas. La implementación comienza con la instalación del SO Ubuntu Server, luego se procede con la configuración de los IP estáticos necesarios para el tráfico de información y la configuración inicial de PostgreSQL para el acceso con el usuario root por defecto, se necesita acceso del tipo SSH entre los servidores para lo cual es necesario crear claves públicas para el acceso remoto desde los diferentes nodos que conforman el cluster. Luego de la configuración SSH se tendrá que configurar la replicación de información para lo cual se utilizó el mecanismo de espejo del motor de Base de Datos PostgreSQL, Stream Replication. Al tener los nodos en espejo ya es posible manipular los roles de los nodos a través del administrador del clúster, el middleware pgpool-ll y después de la configuración del middleware es necesario configurar la alta disponibilidad del controlador del clúster a través de la herramienta por excelencia en Linux para alta disponibilidad, Heartbeat. los resultados obtenidos luego de la implementación del clúster son: alto rendimiento del servicio de datos, escalabilidad en la arquitectura del clúster, balanceo de carga entre los nodos del clúster los cuales se distribuyen el tráfico de información y las transacciones requeridas, haciendo así que se aminore el procesamiento en los nodos del clúster. Al tener un alto rendimiento respecto a la continuidad ante caída de nodos (failover) se pudo reducir el tiempo de inoperatividad estimado llegando a tener el 99.99 de disponibilidad de la información en un año.