Crónica / Reportaje

Copia de seguridad completa, incremental o diferencial: cómo elegir el tipo adecuado

Proteger los datos contra la péDRida, el deterioro, las catástrofes (naturales u obra del hombre) y demás problemas es una de las máximas prioridades de las empresas de informática. Conceptualmente, las ideas son sencillas, aunque puede resultar difícil implantar un conjunto de operaciones de backup eficiente y efectivo.

Durante las últimas décadas, el término backup se ha convertido en sinónimo de protección de datos, y se puede llevar a cabo mediante diversos métodos. Se han desarrollado aplicaciones de software de backup para reducir la complejidad de la ejecución de operaciones de backup y restauración. Hacer copias de seguridad de los datos sólo es una parte de un plan de protección contra los desastres, y si el proceso no se diseña y somete a prueba concienzudamente, es posible que no proporcione el nivel de capacidades de recuperación de desastres y de protección de datos deseado.

El objeto de la mayor parte de los backups consiste en crear una copia de los datos, de forma que se pueda restaurar un archivo o aplicación concretos tras la péDRida o supresión de los datos o debido a un desastre. Por lo tanto, el backup no es el objetivo, sino un medio de cumplir el objetivo de proteger los datos. La comprobación de los backups es tan importante como copiar y restaurar los datos. Una vez más, la utilidad de hacer copias de seguridad de los datos consiste en permitir su restauración más adelante. Si no se comprueban periódicamente, es imposible garantizar que se está cumpliendo el objetivo de proteger los datos.

Aunque se trata de operaciones distintas, en ocasiones se confunde la realización de copias de seguridad de los datos con el archivo de los datos. Un backup o copia de seguridad es una copia secundaria de los datos, utilizada a efectos de protección de los datos. En cambio, el archivo contiene los datos primarios, y se traslada a un tipo de soporte menos caro (como la cinta) para guaDRarlo a largo plazo a menor costo.

Hace mucho que las aplicaciones de backup ofrecen varios tipos de operaciones de backup. Los tipos de backup más corrientes son el backup completo, el backup incremental y el backup diferencial. Existen otros tipos de backup, como el backup completo sintético, la copia en espejo, el backup incremental inverso y la protección de datos continua (CDP).

Backups completos

El tipo de operación de backup más básico y completo es el backup completo. Como su propio nombre indica, este tipo de backup copia la totalidad de los datos en otro juego de soportes, que puede consistir en cintas, discos, o en un DVD o CD. La ventaja principal de la realización de un backup completo en cada operación es que se dispone de la totalidad de los datos en un único juego de soportes. Esto permite restaurar los datos en un tiempo mínimo, lo cual se mide en términos de objetivo de tiempo de recuperación (RTO). No obstante, el inconveniente es que lleva más tiempo realizar un backup completo que de otros tipos (a veces se multiplica por un factor 10 o más), y requiere más espacio de almacenamiento.

Por lo tanto, sólo se suelen realizar backups completos periódicamente. Los centros de datos que manejan un volumen de datos (o de aplicaciones críticas) reducido pueden optar por realizar un backup completo cada día, o más a menudo aún en ciertos casos. Lo normal es que en las operaciones de backup se combine el backup completo con backups incrementales o diferenciales.

Backups incrementales

Una operación de backup incremental sólo copia los datos que han variado desde la última operación de backup de cualquier tipo. Se suele utilizar la hora y fecha de modificación estampada en los archivos, comparándola con la hora y fecha del último backup. Las aplicaciones de backup identifican y registran la fecha y hora de realización de las operaciones de backup para identificar los archivos modificados desde esas operaciones.

Como un backup incremental sólo copia los datos a partir del último backup de cualquier tipo, se puede ejecutar tantas veces como se desee, pues sólo guaDRa los cambios más recientes. La ventaja de un backup incremental es que copia una menor cantidad de datos que un backup completo. Por ello, esas operaciones se realizan más deprisa y exigen menos espacio para almacenar el backup.

Backups diferenciales

Una operación de backup diferencial es similar a un backup incremental la primera vez que se lleva a cabo, pues copiará todos los datos que hayan cambiado desde el backup anterior. Sin embargo, cada vez que se vuelva a ejecutar, seguirá copiando todos los datos que hayan cambiado desde el anterior completo. Por lo tanto, en las operaciones subsiguientes almacenará más datos que un backup incremental, aunque normalmente muchos menos que un backup completo. Además, la ejecución de los backups diferenciales requiere más espacio y tiempo que la de los backups incrementales, pero menos que la de los backup completos.

Tabla 1: Comparación de diversas operaciones de backup

 

Tipo/número de backup
 

Completo
 

Incremental
 

Diferencial

Backup 1
 

Todos los datos
 

--
 

--

Backup 2
 

Todos los datos
 

Cambios desde backup 1
 

Cambios desde backup 1

Backup 3
 

Todos los datos
 

Cambios desde backup 2
 

Cambios desde backup 1

Backup 4
 

Todos los datos
 

Cambios desde backup 3
 

Cambios desde backup 1

Como indica la "Tabla 1: Comparativa de diversas operaciones de backup," cada tipo de backup funciona de forma diferente. Hay que realizar un backup completo al menos una vez. Después, se puede realizar otro backup completo, incremental o diferencial. El primer backup parcial realizado, ya sea diferencial o incremental, guaDRará los mismos datos. En la tercera operación de backup, los datos copiados con un backup incremental se limitan a los cambios desde el último incremental. En cambio, el tercer backup con backup diferencial copia todos los cambios desde el primer backup completo, que es el backup 1.

A partir de estos tres tipos de backup principales, se puede definir una estrategia propia para la protección de datos. Normalmente se utiliza uno de los enfoques siguientes:

-Completo diario

-Completo semanal + Diferencial diario

-Completo semanal + Incremental diario

En la elección de la estrategia de backup óptima hay que sopesar numerosas consideraciones. Normalmente, cada alternativa y opción estratégica tiene sus ventajas e inconvenientes en términos de rendimiento, niveles de protección de los datos, cantidad total de datos conservados, y costo. En la "Tabla 2: impacto de las estrategias de backup en las necesidades de espacio" incluida más abajo, se indican las necesidades típicas de capacidad y soportes de recuperación de las tres estrategias de backup. Esos cálculos se basan en un volumen total de datos de 20 TB, con una variación diaria del 5% de los datos, y sin incremento del almacenamiento total durante el periodo considerado. Los cálculos se basan en un supuesto de 22 días hábiles al mes y de un periodo de conservación de los datos de un mes.

Tabla 2: Impacto de las estrategias de backup en las necesidades de espacio

 

Guiones de backup corrientes
 

Espacio de soporte necesario para un mes (20 TB @ tasa de variación diaria del 5%)
 

Soportes necesarios para la recuperación

Completo diario (días laborables)
 

Espacio para 22 backups diarios completos (22 * 20 TB) = 440.00 TB
 

Backup más reciente solamente

Completo (semanal) + Diferencial (días laborables)
 

Completos, más el diferencial más reciente desde el último completo
(5 * 20 TB) + (22 * 5%* 20 TB) = 124.23 TB
 

Completo más reciente + diferencial más reciente

Completo (semanal) + Incremental (días laborables)
 

Completos, más todos los incrementales desde el último completo semanal
(5 * 20 TB) + (22 * 5% * 20 TB) = 122.00 TB
 

Completo más reciente + todos los incrementales desde el último completo

Como se puede observar en la tabla, lo que más cantidad de espacio y más tiempo requiere es realizar un backup completo diario. Sin embargo, se dispone de más copias totales de los datos, y para realizar una operación de restauración hay que recurrir a menos soportes. Por ello, la implantación de esta política de backup presenta una mayor tolerancia a las catástrofes, y ofrece la restauración más rápida, puesto que cualquier conjunto de datos necesarios se encontrará en un máximo de un juego de backup.

Alternativamente, la realización de un backup completo semanal combinado con la ejecución de backups incrementales diarios ofrece la mayor rapidez de realización de los backups en días laborables y utiliza la menor cantidad de espacio de almacenamiento. Sin embargo, se dispone de menos copias de los datos y la restauración lleva más tiempo, pues es posible que haya que utilizar hasta seis juegos de soportes para recuperar la información necesaria. Si se necesitan datos de la copia de seguridad de un miércoles, hay que recurrir a los juegos de soportes que contienen el backup completo del domingo, más los juegos de soportes que contienen los backups incrementales del lunes, el martes y el miércoles. Esto puede prolongar espectacularmente los tiempos de recuperación, y exige que cada juego de soportes funcione correctamente; un fallo en un juego de backup puede comprometer toda la restauración.

La ejecución de un backup completo semanal más backups diferenciales diarios ofrece resultados intermedios entre las otras alternativas. Concretamente, para restaurar los datos hacen falta más juegos de soportes de backup que con una política de backup diario completo, pero menos que con una política de backup diario incremental. Además, el tiempo de restauración es menor que cuando se utilizan backups diarios incrementales, y mayor que con backups diarios completos. Para restaurar los datos de un día concreto, hay que recurrir a un máximo de dos juegos de soportes, lo cual reduce el tiempo necesario para la recuperación y los problemas potenciales planteados por un juego de backup ilegible.

En las entidades que tienen volúmenes de datos reducidos, la ejecución de un backup diario completo depara un alto nivel de protección sin gran costo adicional de espacio de almacenamiento. Para las entidades más grandes o con más datos, la mejor opción es la ejecución de un backup completo semanal combinado con backups diarios incrementales o diferenciales. La utilización de copias diferenciales brinda un mayor nivel de protección de datos con tiempos de restauración más cortos en la mayor parte de los casos, con un pequeño incremento del volumen de almacenamiento. Por ese motivo, la utilización de una estrategia de backups completos semanales junto con backups diarios diferenciales es una buena opción para numerosas entidades.

La mayor parte de las opciones de backup avanzadas, como el completo sintético, la copia en espejo, el backup incremental inverso y el CDP requieren que el destino del backup sea un almacenamiento en disco. Un backup completo sintético simplemente reconstruye la imagen del backup completo utilizando todos los backups incrementales o el backup diferencial guaDRado en disco. A continuación, ese backup completo sintético se puede restaurar en cinta para su almacenamiento fuera de la sede, y la ventaja es que se reduce el tiempo de restauración. La copia en espejo consiste en copiar los datos almacenados en el disco de backup a otro juego de discos, y los backups incrementales inversos se utilizan para añadir soporte de backup de tipo incremental. Por último, el CDP permite un mayor número de puntos de restauración que las opciones de backup tradicionales.

A la hora de decidir el tipo de estrategia de backup, la cuestión no es tanto qué tipo de backup utilizar, como cuándo utilizar cada una de las opciones y cómo combinarlas con la realización de pruebas para cumplir los objetivos generales de costos comerciales, rendimiento y disponibilidad.

Información sobre el autor: Russ Fellows es Analista superior de Evaluator Group Dirige la investigación y el análisis de productos y tendencias de mercado de NAS, bibliotecas de cinta virtuales, y seguridad del almacenamiento. También es analista principal para la cobertura de matrices seleccionadas de sistema abierto y productos de virtualización.


Esto fue publicado por primera vez en agosto 2008