martes, 8 de mayo de 2012

Mejor estrategia para backup datos


Respuesta Fernando Reyes:
Bueno, depende qué quieres acelerar, el backup o la restauración y de la cantidad de espacio que puedes ocupar. Si quieres tener una restauración rápida lo mejor es como lo estás haciendo, si quieres ahorrar espacio hay que pasar al modo diferencial y si lo que quieres es ahorrar el máximo espacio posible usar el incremental. Veamos las diferencias entre ambos:
  • Diferencial: se hace backup de todos los ficheros modificados después del último backup completo:
    • Haciendo backup: el tiempo de backup y el tamaño del backup son mucho menores que con el completo y mayores que con el incremental, y se incrementa la dureción y tamaño en función del número de diferenciales realizados desde el último backup completo (pues el diferencial 3 contiene los cambios del 2 y del 1 más los propios del 3).
    • Restaurando: la restauración tarda más que con el completo y menos que con el incremental. Esto es porque para realizar la restauración es necesario primero restaurar el último backup completo y después el último diferencial.
  • Incremental: sólo se realiza backup de los ficheros modificados desde el último backup completo o incremental:
    • Haciendo backup: el tiempo de backup es menor que en el caso del completo y del diferencial, y su duración sólo depende de los cambios realizados desde el último backup, independientemente de cuántos backups incrementales se hayan realizado desde el último completo (el incremental 3 sólo tiene los cambios desde el 2, el 2 desde el 1 y el 1 desde el completo).
    • Restaurando: la restauración es la que más tarda, pues es necesario restaurar el último completo y a continuación todos los incrementales en orden de creación (se restaura el completo, luego el 1, luego 2 y luego el 3); esto implica qe cuántos más backups incrementales se hayan realizado desde el último completo, mayor sea el número de reaturaciónes necesarias.
Dados estos ingredientes, la ensalada tienes que aliñártela a tu gusto, pues cada uno se ajusta más a lo que necesita. Te puedo dar una posibilidad que es muy común:
Realizar un completo a la semana y el resto de días de la semana un incremental. El primer día del mes se hace un completo y se guarda, lo mismo el primer día del año. Las cintas de los incrementales son reutilizadas de una semana a otra, y las de los completos semanales se pueden guardan con la vieja táctica del abuelo, el padre y el hijo: se tienen 4 cintas, de manera que se reutiliza la de hace cuatro semanas, quedándonos la de la última semana (hijo), la anterior (padre) y la anterior a ésta (abuelo). Esto permite que se pueda siempre restaurar cada uno de los meses del un año, cada una de las semanas del último mes (últimas 4 semanas en realidad), o cada uno de los días de la última semana. Pongamos que la completa la haces el Viernes; si quieres restaurar el Lunes, debes restaurar el Viernes, el Sábado, el Domingo y por fin el Lunes. Si en lugar de hacerlo así lo haces con diferenciales, para restaurar el Lunes sólo tendrías que restaurar el Viernes y a continuación el Lunes.

por Fernando Reyes.

Pregunta Usuario:
Fernando, le he estado dando unas vueltas y,
En el caso de backup hacia carpeta de disco, si la información a copiar es voluminosa (digitalización documental, muchos archivos y carpetas que incluso casi exceden de la vieja limitación de 255 caracteres) excede de la vieja capacidad de una cinta, creo que requiere de una estrategia adaptada a dicha situación. Hoy en día es habitual (debido a que los usuarios nunca borran nada y la información no deja de crecer), encontrarnos con volúmenes de datos de entre 0,5 Tb y 2 Tb
En el caso de grandes volúmenes de datos NAS aunque la mejor protección es padre, hijo, abuelo, no es frecuente que las Pymes tengan redundada la capacidad disco en 5 o 10 veces para poder gestionar la copia.
Suponiendo que pudiéramos conformarnos con un sistema de menos copias completas en total, podríamos reducir las semanales a dos. (para datos de vida o muerte más pequeños se puede usar una tarea aparte con la perspectiva clásica GFS - Grandfather, father, son)
En cuanto a las mensuales, sería un lujo poder contar con 12. Creo que habrá que conformarse con dos también, lo que nos permitiría poder recuperar dos meses y pico (mensuales alternas + los últimos diarios).
La proposición ideal:
Deberíamos disponer de dos carpetas de disco disco configuradas como dispositivo de copia, y en sus características se define un período respectivamente de:
Carpeta DIARIOS. El período de protección contra sobrescritura debería ser de 23h. Mientras que el período de agregación debería de ser infinito, para poderse reutilizar sin problemas. 
Carpeta SEMANALES. El período de protección contra sobrescritura debería ser de 6 días. El período de agregación debería ser 13 días. En este caso, cada dos semanas se reutilizarían los medios. Osea tendremos los datos de S1 (usados la primera y tercera semana) y los datos de S2 (usados la segunda y cuarta semana). 
Hasta aquí bien, pero sólo hemos conseguido un período de retención de un mes ESCASO.
Lo ideal es añadir la tarea MENSUAL que use una nueva carpeta MENSUAL. Sus características podrían ser: período de protección contra sobreescritura 27 días. En cuanto al período de agregación podría ser de 360 días. Esto nos permitiría usar los medios creados por la carpeta mensual, cada mes durante un año. Luego hay que sacarlos a mano a medios fuera de línea para poderlos retirar y archivar en un disco USB o lo que sea.
Todo esto, en teoría debería de funcionar, pero claro, limitado a que sólo tenemos una copia mensual (para ahorrar espacio).
A partir de aquí deberíamos de ser cada uno los que hagamos el 'tunning' entre espacio y tiempo guardado. Yo añadiría, una tercera tarea que sea trimestral, para estar tranquilos.
Hay una regla que da prioridad a la semanal sobre la tarea diaria, y a la mensual sobre la semanal. Además el calendario  programa cuando se ejecutará cada tarea.
A ver si entre todos sacamos una estrategia adecuada. Por favor, añadir sugerencias

Respuesta:
Bueno, tu estás hablando de hacer copias a disco, mientras que Zidac preguntaba sobre copias en cinta. La respuesta que le di digamos que era de lo más standar y que tenía como finalidad más el darle conceptos que darle la solución final, pues esta debe ser hecha por él, que sabe de qué necesidades dispone y qué limitaciones le afectan.
Respecto a tu estrategia de hacer las copias en disco, lo mejor es usar aplicaciones que permitan basar las copias en Deltas de disco, pues se ahorra mucho espacio; hablo de software como por ejemplo System Center Data Protection Manager. Con DPM tú puedes obtener de disco las recuperaciones recientes y almacenar en cinta las "históricas" y los backups basados en Deltas de disco ocupan muy poco sitio, lo que más ocupa es la copia completa inicial.
En fin, todo esto es un tema muy largo y con muchas opciones, como te he dicho antes, mi respuesta iba encaminada a aclararle a Zidac los conceptos de las copias incrementales y diferenciales (petición que hacía) y a mostrarle una estrategia "escolástica", que es más un dar a conocer conceptos que ayuden a definir la estrtegia propia.



No hay comentarios: