- Pregunta #1: ¿es técnicamente posible obtener su objetivo de tiempo de recuperación (RTO) y el objetivo de punto de recuperación (RPO) a cero o cerca de cero?
- Respuesta: Sí.
- Pregunta # 2: ¿realmente quieres?
- Respuesta: tal vez no.
espere, ¿por qué no debe obtener RTO y RPO a cero o cerca de cero?,
comprensión de RPO y RTO
las organizaciones de TI bien administradas utilizan las mejores prácticas de protección de datos para evaluar el riesgo de pérdida de datos y establecer políticas de resiliencia de TI (ITR) para garantizar la continuidad del negocio. Los CIO y los gerentes de TI deben comenzar con una comprensión común de lo que es RPO y RTO en el almacenamiento, con respecto a la copia de seguridad y la recuperación ante desastres.
El objetivo de punto de recuperación (RPO) y el objetivo de tiempo de recuperación (RTO) son dos de los parámetros más críticos de un plan de protección de datos y una estrategia de recuperación ante desastres., Estas mediciones están relacionadas y son necesarias con la aplicación y la disponibilidad de datos. A pesar de sus similitudes, RPO y RTO tienen diferentes propósitos y vienen con diferentes métricas.
- Objetivo del punto de recuperación = riesgo de datos. RPO se refiere a la cantidad máxima aceptable de pérdida de datos que una aplicación puede sufrir antes de causar un daño mensurable a la empresa.
- Objetivo de tiempo de recuperación = Tiempo de inactividad. RTO indica cuánto tiempo de inactividad experimenta una aplicación antes de que haya una pérdida comercial mensurable.,
cortesía de Enterprise Storage por Christine Taylor
objetivos de recuperación
todo el mundo sabe que el correo electrónico es una aplicación crítica para el negocio que solo puede estar disponible durante una hora o más antes de que la mayoría de las empresas registren pérdidas de productividad. (Las quejas de los empleados son otra historia. Sin embargo, una base de datos de transacciones de clientes puede no estar disponible durante menos de dos minutos antes de demostrar el daño financiero y reputacional.,
- rpo ejemplo: si la última copia disponible de datos durante una interrupción es de hace 18 horas, y el RPO para este negocio es de 20 horas, entonces todavía estamos dentro de los parámetros del RPO de la política de resiliencia de TI. El RPO entonces responde a la pregunta – » ¿hasta qué punto en el tiempo podría la recuperación proceder aceptablemente, dado el volumen de datos perdidos durante ese período?,»
- RTO ejemplo: siempre que su RTO sea de cinco horas, lo que significa que su negocio puede sobrevivir al tiempo de inactividad durante este intervalo, su política de ITR deberá garantizar altos niveles de preparación para garantizar que los sistemas se puedan recuperar rápidamente. Por el contrario, si la RTO es de dos semanas, se pueden desarrollar diferentes planes de protección de datos para alcanzar la disponibilidad de los datos.
es la mejor práctica la necesidad de hacer coincidir los objetivos de tiempo y punto de recuperación (RTPO) con la prioridad de la aplicación. Para las aplicaciones de misión crítica raras, minimizar el riesgo puede requerir cero o casi cero RPOs y RTOs, a pesar del gasto.,
por qué cero RTPO cuesta
la mejor manera de lograr cero/casi cero RPO y RTO es la duplicación sincrónica. Funciona escribiendo e/s sincrónicamente desde el medio de almacenamiento primario a un segundo sistema reflejado, y esperando el acuse de recibo antes de escribir el siguiente conjunto de E/s del primario al sistema reflejado. La copia secundaria se almacena en un estado activo para su recuperación inmediata, piense en alta disponibilidad (HA) en un servidor clúster de doble nodo.,
esta configuración de procesamiento intensivo necesita sistemas de almacenamiento de alto rendimiento y el máximo ancho de banda para minimizar los impactos en el rendimiento, lo que agrega administración, tiempo y gasto. Las capas adicionales, como los sistemas de bases de datos, el hardware y el software de agrupación en clústeres y las funciones de replicación de bases de datos nativas, añaden más costes y complejidad. Cada capa requiere que los expertos de TI configuren, integren y administren dentro de la infraestructura RTO/RPO.
lograr cero / casi cero en este entorno es posible pero no fácil., Aún así, la replicación síncrona es la mejor opción para aplicaciones transaccionales de misión crítica porque no requiere movimiento de datos, rehidratación o espera. Es un medio altamente exitoso y costoso para lograr objetivos de recuperación cero/casi cero.
en lugar de cero, ¿qué tal 15 minutos?
¿Qué pasa con las aplicaciones críticas para el negocio? Es excesivo pagar por cero / casi cero RPO y RTO para la mayoría de las aplicaciones. Sin embargo, la duración media de los objetivos de recuperación es demasiado larga para las aplicaciones críticas para el negocio.,
veamos dos posibilidades que deberían cubrir la mayoría de las aplicaciones empresariales: cero / casi cero RPO y RTO para las aplicaciones más críticas, y RTP y RPO de solo 15 minutos para todo lo demás que necesite tiempos objetivos cortos.
si puede reducir ese RPO / RTO a 1 hora a las velocidades más lentas o 15 minutos a las más altas, logrará tiempos de recuperación y publicaciones rápidos para la mayoría de sus aplicaciones. Según George Crump de Storage Switzerland, el «secreto» son las recuperaciones in situ para RTO y las copias de seguridad de bloques de cambio para RPO.
- RTO: recuperación in situ., Las funciones de recuperación in situ funcionan recuperando rápidamente los datos de copia de seguridad de los dispositivos de copia de seguridad, sin tener que reconstituir los datos del formato de copia de seguridad. El ancho de banda puede ser un obstáculo y determinará qué tan rápido funciona, así que asegúrese de que su infraestructura pueda admitir copias de seguridad remotas o en la nube. Logrará el RTO más rápido almacenando en caché los datos de copia de seguridad activa en las instalaciones para la recuperación in situ.
- RPO: cambiar copias de seguridad de bloques. Al realizar copias de seguridad de bloques modificados únicamente, puede realizar copias de seguridad frecuentes sin afectar el rendimiento de la red., Esto significa que la cantidad de datos entre copias de seguridad es mínima, lo que permite RPOs mucho más bajos.
todavía querrá asignar una frecuencia de copias de seguridad de bloques y decidir sobre los datos de prioridad para almacenar en caché, por lo que no todos los RPO o RTO serán de 15 minutos o menos. Sin embargo, ciertamente puede lograr 15 minutos con las aplicaciones que los necesitan, y una hora o menos para el resto a un precio muy razonable.
Cortesía de Veeam.
¿Cuánto tiempo y datos puede ahorrar una empresa?, Una encuesta de Veeam sobre RPO y RTO, «uso de Veeam en la nueva carrera a cero: resultados de la Encuesta de clientes», informó que los encuestados redujeron el tiempo de restauración en un 77% y ahorraron 10,2 horas por año de tiempo de inactividad en sus entornos virtuales. Según IDC, las empresas tienen un costo promedio de 1 100,000 por hora de inactividad. La encuesta de clientes de Veeam demuestra que las nuevas tecnologías RPO y RTO ofrecen mejores objetivos de recuperación a un coste mucho menor.,
RTPO next steps
hay nubes bajo demanda que ofrecen un entorno DIY, y luego hay proveedores de servicios en la nube personalizados que pueden hacerlo todo, sin los costos ocultos. Una indicación de que el proveedor lo hace todo es que está dispuesto a proporcionar DRaaS y SLA personalizados para cumplir con una política de resiliencia de TI. Si su nube de copia de seguridad y recuperación de datos no puede hacer eso, entonces debe revisar su plan de protección de datos para obtener una solución personalizada diseñada para proporcionar métricas de RPO y RTO medibles, confiables y repetibles.,
la nube de KeepItSafe es rara en su capacidad de proporcionar el soporte, la experiencia y la agilidad necesarios para ofrecer copias de seguridad en la nube, DRaaS y resiliencia de TI. Ya sea una pequeña empresa, una empresa del mercado medio o una empresa Fortune 1000, KeepItSafe tiene las funciones de copia de seguridad y recuperación que satisfarán sus necesidades específicas. Y lo mejor de todo, puede experimentar todas las funciones de ahorro de costos y beneficios de ahorro de tiempo de KeepItSafe comenzando con una prueba de 30 días.,
los Lectores de este blog también están interesados en este seminario web:
Cómo Crear un Gran Plan de Recuperación de Desastres
Deja una respuesta