Planificación de recuperación ante desastres - RTO, RPO y failover

Lectura de 2 min aprox.

La recuperación ante desastres (DR: Disaster Recovery) es un término general para los planes y procesos que, basándose en procedimientos y objetivos definidos de antemano, restauran los sistemas de TI cuando se detienen debido a desastres naturales, ciberataques, fallos de hardware y similares. El nivel de recuperación se define mediante dos métricas, el RPO (objetivo de punto de recuperación) y el RTO (objetivo de tiempo de recuperación), con el fin de minimizar el impacto en el negocio. A fecha de 2025, la difusión del DRaaS basado en la nube (Disaster Recovery as a Service) ha permitido que incluso las pequeñas y medianas empresas construyan una estructura de DR a un coste asequible.

Casos de uso reales

«Un fallo del aire acondicionado en el centro de datos hizo que la temperatura de la sala de servidores se disparara, lo que provocó un apagado de emergencia de los sistemas principales. Conforme a nuestro plan de DR, conmutamos por error a otra región de AWS y restauramos todos los servicios en una hora y 40 minutos, frente a un objetivo de RTO de dos horas.»

El flujo del proceso de DR

Evaluación de riesgos y BIA (análisis de impacto en el negocio)

Definición de RPO / RTO y formulación de la estrategia de recuperación

Construcción de entornos de copia de seguridad y replicación

Realización periódica de simulacros y pruebas de DR

Ejecución de la conmutación por error y verificación de la recuperación cuando ocurre un incidente

La diferencia con el BCP

Mientras que el plan de continuidad del negocio (BCP) es una estrategia de continuidad para todo el negocio, la DR es un plan técnico especializado en la restauración de los sistemas de TI. Si bien un BCP también abarca aspectos como asegurar oficinas alternativas y confirmar la seguridad de los empleados, la DR se centra en los procedimientos de recuperación de servidores, bases de datos y redes. La DR es un componente crucial de un BCP, y resulta indispensable operar ambos de forma coordinada.libros introductorios sobre planificación de DR (Amazon) te permiten estudiarlo de forma sistemática.

La elección de la estrategia de recuperación

Una estrategia de DR se elige según el equilibrio entre el coste y la velocidad de recuperación. Un sitio frío (donde solo se prepara una infraestructura mínima) tiene un bajo coste, pero tarda varios días en recuperarse. Un sitio templado (donde se mantienen en funcionamiento algunos sistemas) puede recuperarse en cuestión de horas. Un sitio caliente (donde un entorno equivalente al de producción se sincroniza en tiempo real) puede conmutar en minutos, pero es el más caro. En los entornos en la nube, predominan las configuraciones de DR flexibles que aprovechan la replicación Cross-Region de AWS o Azure Site Recovery. Establece una contraseña única y robusta para cada servicio a fin de proteger la consola de administración de tu entorno de DR, y combínala con una estrategia de copias de seguridad para construir una estructura de recuperación sólida.libros sobre DR en la nube (Amazon) también son una referencia útil.

Términos relacionados

¿Te resultó útil este artículo?

← Volver al glosario