P. 1
Cómo Diseñar Un Sistema de Backup Para Su Compañía

Cómo Diseñar Un Sistema de Backup Para Su Compañía

|Views: 3,510|Likes:
Published by Fabian Cortes
Documento para el entendimiento de un sistema de backup y las implicaciones de su implementación al interior de una organización
Documento para el entendimiento de un sistema de backup y las implicaciones de su implementación al interior de una organización

More info:

Published by: Fabian Cortes on Jul 16, 2011
Copyright:Attribution Non-commercial No-derivs

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

08/10/2015

pdf

text

original

COMO DISEÑAR UN SISTEMA DE BACKUP PARA SU COMPAÑÍA

Espero que en este momento libre, el redactar el documento implique cumplir con la meta que propone el título. Gracias a todos por los comentarios de los artículos anteriores. Conceptos Básicos de backup Un backup está sujeto a los siguiente elementos: • • • Tipo de backup Periodicidad del backup Pool de Rotación

Tipos de Backups Es muy probable que muchos de ustedes ya conozcan que existen tres tipos básicos de backup que son: a) Full Backup o Total Este tipo de backup quiere decir que se hará un respaldo a Total: toda la información seleccionada. E el tipo de backup que consume más a Es recursos desde el punto de vista de tiempo y almacenamiento, y aunque es el más costoso, también es el más confiable porque no depende si de sí mismo. sino Sin embargo, a la hora de realizar una recuperación, es mucho más simple porque no debe recurrir a otros backups como referencia para restaurar la información.
Cintas de Rotación Histórico

Full Backup 1 Full Backup Semanal 1 Full Backup Semanal 2 Full Backup Semanal 3

Full Backup 2

Full Backup Semanal 1

Full Backup Semanal 2

Full Backup Semanal 3

Full Backup 3

A B C

2 MB 1 MB 1 MB

A B

2 MB 1 MB

Cintas de Rotación Semanal Si la información al final del mes no ha variado de tamaño la cinta histórica es contendrá 4MB

C

1 MB

aunque A y C cambiaron, en un estrategia de Full Backup se hace backup a todo es decir a los 4MB

Figura No. 1 - Esq Esquema de sistema de backup con Full Backup (Cortés, 2011) ,

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 1 de 14)

b) Backup Incremental: Este tipo de backup necesita un punto de referencia el referencia, cual es a través de un backup total, para que apartir de allí se pueda establecer qué información ha cambiado y en qué proporción y a esa información hacerle proporción, backup, a la parte del archivo que cambió. Esta estrategia de backup es más rápida a la hora de respaldar, pero es la más lenta en recuperación, porque el respaldar, sistema de backup debe armar toda la trayectoria del cambio y eso i implica buscar los medios, y a nivel de procesos esto implica tiempo. Para iniciar un s backup incremental, siempre primero se debió arrancar con un backup total.

Cintas de Rotación Histórico

Un Full Backup siempre es el punto de partida

Full Backup 1
Backup Incremental Semanal 1 Backup Incremental Semanal 2 Backup Incremental Semanal 3

Full Backup 2

Full Backup Semanal 1

Full Backup Semanal 2

Full Backup Semanal 3

Full Backup 3

A B C

2 MB 1 MB 1 MB

A B

500 KB 100 KB

A

50 KB

Cintas de Rotación Semanal Si la información al final del mes no ha variado de tamaño la cinta histórica es contendrá 4MB

Sentido para el backup Cuando se hizo el full backup se tomó 4 MB La siguiente semana a A se le modificó 500KB de su total y a B 100 KB Entonces el backup Incremental es de 600KB que es más rápido que hacer a 4MB En la semana 2 el backp incremental es de 50KB Sentido para la recuperación Para lograr restaurar se requiere el Full Backup 1, Incremental Semana 1 e Incremental Semana 2 La restauración es más lenta y se requiere toda la cadena para poder recuperar el archivo

Figura No. 2 - Esquem de sistema de backup con Backup Incremental (Cortés, 2011) ma

c) Backup Diferencial: Es un tipo de backup que al igual que el anterior, requiere : e un backup total como punto de partida y a partir de allí determinar qué información ha cambiado y a esa información en su totalidad hacerle respaldo. cambiado, A diferencia del incremental, hace backup de todo el achivo que ha c cambiado y no de la parte dentro del mismo que ha cambiado. Es un proceso de backup mucho más rápido que el full backup, más lento que el incremental, pero a nivel de restauración es más rápido que el incremental y más lento que el backup total, porque depende menos medios para construir la cadena de l, depende recuperación. Puede ser representado como sigue:

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 2 de 14)

Cintas de Rotación Histórico

Un Full Backup siempre es el punto de partida

Full Backup 1
Backup Diferencial Semanal 1 Backup Diferencial Semanal 2 Backup Diferencial Semanal 3

Full Backup 2
Backup Diferencial Semanal 1 Backup Diferencial Semanal 2 Backup Diferencial Semanal 3

Full Backup 3

A B C

2 MB 1 MB 1 MB

A B

2 MB 1 MB

A

3 MB

Cintas de Rotación Semanal Si la información al final del mes no ha variado de tamaño la cinta histórica es contendrá 4MB

Sentido para el backup Cuando se hizo el full backup se tomó 4 MB La siguiente semana a A y B fue modificado el backup total en esa modificado, semana 1 es de 3 MB, en la semana 2 A aumento a 3 MB lo demás siguió igual, por ende el backup en esa semana es de 3 MB que es el nuevo tamaño de A.

Sentido para la recuperación Para lograr restaurar se requiere el Full Backup 1, Iel diferencial del punto a restaurar, no es necesario toda la secuencia secuencia.

La restauración es más rápida que el incremental y no se requiere toda la cadena para poder recuperar el archivo

Figura No. 3 - Esque uema de sistema de backup con Backup Diferencial (Cortés, 2011)

Periodicidad del Backup: La periodicidad establece la frecuencia con la cual se va a hacer el backup de la información, y técnicamente esto nos brinda el RPO (Recovery Point objective); es decir, cuando ocurra un evento qué tanto hacia atrás nos podemos devolver, cuá es el , cuál rango de tiempo que se acepta y en el cual no se hace backup y por el cual se puede perder información, pero que es aceptado desde punto de vista organizacional es , organizacional, decir es el periodo entre un backup y el siguiente. La variabilidad de la información y siguiente. su criticidad determinarán la combinación de los tipos de backups que son neces necesarios para un proceso adecuado. S embargo a este respecto es necesario mencionar, por Sin experiencia, que ante problemas presupuestales son estos condicionantes los que presupuestales, dictan los tipos de backup que se deben seguir seguir. La combinación de perdiodici nación perdiodicidad y tipo de backup, determinan el RPO y RTO (Recovery Time Objective), este último establece el tiempo que se demorará el sist sistema en recuperar la información, al igual que la estrategia, es decir, si el backup debe ser de Disco a Disco (D2D – Disk To Disk de Disco a Cinta (D2T – Disk To Tape o de Disco a Disk), Tape) Disco a Cinta (D2D2T), de acuerdo a las velocidades de recuperación que se esperan. Siendo la D2D la más rápida.

Figura No. 4 - sobre el RPO y el RTO en plataformas de backup (Hill Associates, 2007) Hill Tomada de http://wiki.hill.com/wiki/index.php?title=RTO

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 3 de 14)

En la gráfica anterior se puede observar que el punto de falla delimita el RPO y el RTO; delimita el RPO es qué tanta información está dispuesta a perder la organización con base en su mación estrategia de backup, y el RTO es qué tan rápido podemos recuperar la información ategia hasta el punto RPO según la tecnología adquirida. La idea es que tanto el RPO como el tanto RTO sean períodos de tiemp cortos, pero esto implica dinero. odos tiempo Dependiendo de la periodicidad del backup y de su tipo, esto determinará los pools de rotación los cuales básicamente se clasifican: • • Pool de rotación Pool histórico

Para entender de qué se trata los pools de rotación se tuilizará este ejemplo: La estrategia de backup consiste en realizar un backup semanal del tipo full backup y al final de cada mes se guarda la información que quedó en la cinta:
Cintas de Rotación Histórico

Full Backup 1

Full Backup 2 Backup Semanal 1 Backup Semanal 2 Backup Semanal 3 Backup Semanal 1 Backup Semanal 2 Backup Semanal 3

Full Backup 3

Cintas de Rotación Semanal

Cintas de Rotación Semanal Se utiliza la cinta de rotación para convertirse en histórica

Figura No. 5 – Entendiendo los pool de rotación e histórico (Cortés, 2011) s,

La cinta del backup semanal 1 del mes 1, vuelve a ser utilizada en la primera semana del mes 2, la cinta semanal 2 del mes 2, vuelve a ser utilizada en la semana 2 del mes 2 la y así sucesivamente. Es decir el pool de rotación como su nombre lo ind ivamente. decir, indica, rota más rápido las cintas que el histórico o para entender mejor, reutiliza más rápidamente las cintas que el histórico. Para efectos de entender, cada mes consta de aproximadamente 4 semanas, de las cada cuales 3 serían las semanas del pool de rotación y una semana sería para el histórico histórico, que sería la última semana del mes. De acuerdo a lo anterior tenemos: • • Pool de rotación = 3 medios o cintas Pool Histórico = 12 medios o cintas (una por mes)

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 4 de 14)

Es decir que bajo el ejemplo ante anterior utilizando una cinta para el backup si ahora backup, tenemos que determinar la inversión del primer año en medios de almacenamiento en (supongamos cintas LTO 5 en este caso entonces se hablaría de 15 Cintas y si su ongamos caso), Cintas, costo es de US$85 cada una, entonces la inversión para el primer año e de 15x85 = 85 es US$1275. Para el siguiente año en teoría solo debería comprarse las del pool de rotación histórico, es decir 12 cintas (porque ya se tiene el pool de rotación) Si el costo se rotación). mantiene, implica que hay que presupuestar en el año 2, 12x85 = US$ US$1020. No sería necesario comprar cintas de rotación, pero en la práctica uno compra al menos 3 ó 4 para prevenir un daño físico en la cinta actuales, y adicional compra cuando menos, 2 año las cintas de limpieza. primer Normalmente, siempre la inversión en medios del primer año es la más costosa, porque es la que determina los pools. Queda a criterio de la organización la rotación del pool histórico que efectivamente tambíen se puede rotar, pero seguramente s su rotación es anual y más lenta, con el fin de minimizar costos y evitar quedar en inventario a los tres años con tecnología que genera costos de espacio físico para ser ubicados en algún lugar dentro o fuera de la organización. Para el ejercicio anterior, el RPO es de 1 semana bajo un esquema de estrategia de full backup, es decir que si hay un problema en la semana tres, se perdería toda la semana ckup, y se tendría que recurrir al backup de la semana dos. El RTO depende de la tecnología elegida y la cual se tratará más adelante adelante.

Hasta este punto se tiene: 1. Tipos de backup y su impacto en el tiempo de backup y la recuperación (RTO). 2. Periodicidad del backup y su impacto en el en RPO. 3. Pool de rotación y su impacto en los costos de la solución e inversiones iniciales y anuales.

Ahora se debe profundizar más en el tema sobre la tecnología y el rendimiento del la proceso de backup y la restauración, como también de elementos de control exigidos por las auditorías.

Comprender la información que se tiene en la organización Características de la información y su impacto en el backup: 1. Información densa y muy pequeña: Cuando se realiza un backup, no es lo mismo hacer backup de 1 GB de un solo archivo, que hacer bac up backup de miles de archivos de 1KB; el rendimiento en el primer caso es superior al del segundo caso. Esto mismo se traslada a escenarios corporativos donde en un sitio se alberga miles de archivos pequeños y se puede apreciar que cuando el proceso

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 5 de 14)

2.

3.

4.

5.

de backup llega a ese punto su rendimiento se ve afectado. Es importante tener en cuenta esto en el diseño. Información contenida en e equipos Linux o Unix: Con el caso de linux sucede un caso muy particular, me ha ocurrido con Backup Exec, NetBackup y Arc Server, y consiste en que se debe setear a full duplex tanto en el switch como en la tarjeta de red del servidor, no es recomendable lanzar el backup dejando todo lanzar en modo auto sensing. Información que está siendo utilizada: Esto implica que la solución de backup debe tener presente que cuando el proceso de backup pase por un servidor que contenga información que se está utilizando, se le pueda hacer backup; llámese una base de datos o archivos de oficina que en ese momento están abiertos. Información que está repetida: Muchas veces las empresas acuden a repositorio de archivos y es muy común que interactuen allí, pero con el riesgo que la información esté repetida en el mismo lugar, por ende es importante que cuando se evalúe una solución de backup se haga un estudio de deduplicación, para determinar la cantidad de información. Escenarios de virtualización: Los escenarios de virtualización requieren de atención especial, porque implica que si ya se tiene virtualizada la , infraestructura, se debe tener cuidado con el datastore y que é éste tenga el suficiente espacio para los snapshot que genera el software de backup. No recomiendo, por ejemplo que el backup de máquinas virtuales aplique a ejemplo, Controladores de Dominio con tecnología Microsoft, ¿la razón crecen la razón?, continuamente y por ende el snapshot también, consumiendo el espacio libre en el datastore rápidamente y generando problemas a futuro. Hace backup de Hacer máquinas virtuales es un proceso que consume tiempo.

Comprender el sistema de backup como estrategia organizacional Un sistema de backup tiene diferentes cognotaciones desde el punto de vista organizacional y básicamente enfoca sus esfuerzos en estos dos puntos en puntos: • • • Es un componente de respaldo de la información en caso de pérdida de la misma. Es para la operatividad del día a día. Es un componente fundamental en el plan de recuperación de desastres (DRP). Es un componente que determina las reglas de juego de respaldo d información de para los usuarios; es decir define las políticas y para qué es el sistema de backup decir, dentro de la organización organización.

NOTA: Sea cual sea el enfoque o camino a seguir, es algo que es dictaminado por la organización y no por área de IT. I ea Insisto, la tecnología contribuye a los objetivos organizaciones y no la tecnología establece qué debe hacer la organización. Es un error plantear una estrategia de backup sin que pase por la aprobación de las directivas de r la organización, mediante un documento breve llamado Políticas de B nte Backup, y el cual auditoría interna y externa exige.

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 6 de 14)

Sistema de backup como un componente operativo del día a día Para atacar este punto es importante conocer los siguientes elementos dentro de su organización: 1. Tipo de información que se maneja dentro de la organización En este punto ipo organización: es importante clasificar la información que posee la organización; es decir, si información está en bases de datos, documentos de oficina, aplicaciones, etc. Es vital conocer esto porque más adelante determinará los tipos de agentes que se adelante requieren para suplir la necesidad de backup sin generar indisponibilidad en el servicio. 2. Ubicación de la información en la arquitectura de hardware: Aquí el tema a hardware: tratar consiste en identificar en qué plataformas de hardware se encuentra la plataformas información del punto 1. Es importante, porque desde el punto de vista de rendimiento (relación entre Velocidad y Tiempo = Ventana de backup), es muy diferente tenerla en un servidor normal tipo torre, rack, blade conectado directamente a la red de datos, a un equipo especializado de almacenamiento tipo SAN o NAS/SAN ya sea conectado con tecnología SAS, iSCSI o Fiber Channel tecnología entre otros. Esto determinará el diseño de la infraestructur de backup y de infraestructura algunas buenas prácticas que en mis años de experiencia es recomendable tener presente. 3. Cantidad de información Como su nombre lo indica, es la cantidad de información: información en GB o TB, a la cual se le debe realizar el backup. Este dato es muy importante, porque finalmente cuando se esté evaluando la tecnología o esté estrategia, determinará la ventana de backup requerida para lograr con éxito el proceso de respaldo de información, como costos de almacenamiento alternos ceso y contratados con terceros, los costos de los pools de rotación e histó terceros, histórico. 4. Ventana de backup: Este término quiere decir el tiempo con que cuenta la backup: organización para desempeñar el proceso de backup, sin que esto implique una afectación de sus servicios. Normalmente siempre se especifica que esto debe hacerse en horas de la noche o en la madrugada, pero en la práctica puede realizarse en cualquier momento siempre que este proceso no afecte el momento, rendimiento de los servicios y genere problemas de operatividad. Al tener claro los puntos anteriores, se procederá a armar el rompeca rompecabezas que ayudará a identificar los requerimientos para desarrollar un proyecto de backup. Armando el rompecabezas de un proyecto de backup Cuando se enfrenta a un proyecto de backup, en el que se debe determinar el software y hardware que hará el procedimiento, es importante tener claro las procedimiento, características de la información que se tiene y que se mencionaron con anterioridad. Esto debido a que los software de backup de hoy en día lo venden en dos líneas sto comerciales: representantes a) Por capacidad: Los partners o representantes comerciales de los fabricantes de sistemas de backup como Symantec, IBM, CA, HP, cuando ofrecen sus productos preguntan si desea adquirir el software de backup con opción por almacenamiento, es decir que el cliente establece en conjunto con un estudio,

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 7 de 14)

la capacidad de almacenamiento total requerida que el software de backup debe tener como límite. Para lograr este estudio se debe contar con una muy organizada bitácora de backup de la cual se hablará más adelante. Por ejemplo si el backup de la empresa es de 600GB y su crecimiento anual es de un 10%, puede pensar en adquirir una solución de backup por almacenamiento con capacidad máxima de 1 TB. Esto quiere decir, que cada proceso de backup que el operador efectue, como máximo podrá hacer 1TB, sin mebargo tiene la ventaja que puede acceder a todos los agentes que requiera, incluso a agentes que no necesita. Por eso es importante identificar bien el tipo de información y la cantidad de la misma. Si por alguna razón la capacidad de la información aumenta, entonces es necesario que se licencie un nuevo Terabyte, y tonces normalmente los fabricantes bajo esta modalidad licencian de esta forma. b) Por agentes: Esta modalidad de compra, implica que se adquiere el software de backup para el servidor y adicional de forma individual se compra los agentes servidor, ndividual compran según el tipo de información a hacerle backup. No es lo mismo hacer backup a un archivo de word que hacerle backup a una base de datos Oracle o MS SQL Server, ya que para eso se requieren agentes diferentes con costos difer diferentes. Los agentes vienen en varias clasificaciones como: a. Agente para archivos abiertos. b. Agente para bases de datos Oracle. c. Agente para Bases de datos Microsoft Exchange. d. Agente para backup a máquinas virtuales. e. Agente para Bases de datos Microsoft SQL Ser Server. f. Agentes para hacer backup del Directorio Activo de Microsoft. g. Etc, etc. Lo importante aquí, es que quien sea el líder del proyecto tenga un inventario preciso del tipo de información a la cual le desean hacer backup, porque así mismo se determinará la cantidad de los agentes requeridos y el costo de la solución, y de esta manera poder comparar si es mejor comprar por almacenamiento o por agentes. macenamiento Desde el punto de vista práctico es más escalable comprar por capacidad, porque mientras no se exceda de la cuota comprada, se puede utilizar todos los agentes, desde ese punto de vista es más escalable que la opción por agentes. Pero hay un desperdicio implícito, porque hay agentes que muy seguramente no se requieren. Caso IBM: Para el caso de IBM su esquema de licenciamiento involucra una mezcla de de Procesadores y Número de máquinas virtuales que finalmente genera una unidad de medida para determinar el costo Es algo un poco complejo de ver a simple vista, así costo. s que queda a su criterio el meterse con este mecani mecanismo de licencia.

Requerimientos que debe considerar en el software de backup Cuando se está evaluando el software de backup, se debe revisar que pueda hacer las siguientes funcionalidades o exigencias:

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 8 de 14)

1. Los software de backups poseen algo llamado Catálogo, que no es más que la metabase de datos que almacena los proceso de backups y su información es información; decir, indica qué información hay en un medio y de qué fecha pertenece Debe pertenece. poderse recuperar la información de un medio aún en ausencia del catálogo, ar aún es decir, sin tenerlo tenerlo. 2. El software debe estar en capacidad de poder crear Jobs o tareas de backup de forma individual donde se pueda colocar los servidores y la información a respaldar, como la hora y el tipo de backup a realizar. 3. Debe poder realizar inventario, etiquetado de los medios y catalogación de los mismos en conjunto con el tapelibrary. 4. Debe poder manejar códigos de barra en caso de ser necesario barras necesario. 5. Debe generar reportes o logs de backup donde se pueda identificar la velocidad de backup por servidor, la cantidad de información a la que se hizo backup y cantidad backup, caso de errores, especificar en qué servidor ocurrió y dónde. 6. Debe poder encriptar el backup de ser requerido por el usuario. 7. Debe poder comprimir la información para mejor mejorar rendimiento en el almacenamiento. 8. Debe poder personalizar la etiquetas que se le colocan a las cintas o al medio local de almacenamiento, para distinguir fácilmente un job de otro. 9. Debe permitir lanzar una limpieza al tape drive, con la respectiva cinta de al limpieza, y debe not notificar al operador de backup cuándo debe hacerse. ndo 10. Debe mandar correos de n notificación donde se informe inicio y fin de un job y job, si es posible de sus detalles. 11. Debe poderse instalar los agentes de distintas formas entre ellas, mandar de forma remota la instalación d los agentes. de

Básicamente un software de backup se resume un schedule, es una relación entre:
Servidores

Hora de Inicio Compresión?

Día de Backup

Debe hacer deduplicación?

SCHEDULE

Tipo de Backup

escribe? Sobre-escribe Localización de la cinta en el tape library

Figura No. 6 – Componentes básicos en un schedule de un backup (Cortés, 2011)

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 9 de 14)

Rendimientos de las tecnologías Para la selección del sistema de backup a nivel del hardware, los escenarios de hoy en backup día utilizan estrategias de backup basadas en D2D, sin embargo si se hace esto a través as de la red, el mejor desempeño sería enlace 10GibitEthernet, pero en la práctica eso es muy costoso y normalmente todo s trabaja a GigabitEthernet, así que existen dos se , conceptos que no deben ser confundidos: • • SAN como red aislada para el backup. SAN como medio de almacenamiento.

La SAN como red aislada permite tener una red (si se puede decir así si así), complemetamente independi independiente de la red de datos y servicios de la organización, lo cual permite un mejor rendimiento y la posibilidad de utilizar una gama de tecnología tecnologías de conectividad. La SAN de almacenamiento es el equipo o el hardware que solo contiene discos para almacenar i información y puede crecer en Terabytes o Petabytes Petabytes, y es donde se aloja la información. Por ejemplo una Dell MD3000i es un claro ejemplo de una SAN de almacenamiento. Teniendo claro lo anterior, un sistema de backup convencional requiere normalmente los siguientes componentes bajo el esquema tradicional: guientes 1. Servidor de backup. 2. SAN de backup para albergar la información y hacer backup D2D. 3. SAN a nivel de red. 4. Tape Library Servidor de backup: Es el componente que contiene el software de backup del fabricante elegido. Su función no es almacenar información, a los sumo solo debe gido. preocuparse por el catálogo del software de backup. Debe ser un equipo con buen procesador (Quad-Core en adelante) y buena memoria RAM (12 GB en adelante) En Core adelante). las diferentes formas de conectar el servidor al tape library se puede hacer por Fiber conectar Channel que brinda una tasa estandar de 8Gbps, puede ser conectado por iSCSI que brinda en promedio 1Gbps, o puede ser por SAS que da hasta 6Gbps. Por ejemplo, en la gráfica que sigue se puede ver un tipo de topología:

SAN

C o n e x ió n S A S , F ib e r C h a n n e l o iS C S I

S e r v id o r d e B a c k u p

T a p e L ib r a r y

S e rv id o r e s a R e s p a ld a r

Figura No. 7 – Toplogía Básica para Backup (Cortés, 2011) igura

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 10 de 14)

En este diseño el problema es que si el backup se hace a través de la red de datos normal, lo máximo que se puede obtener es la velocidad de la misma generando un misma, cuello de botella independiente de la manera en la que cual conecte la SAN y el conecten TapeLibrary al servidor. Si definitivamente el mejor escenario es el anterior, entonces se debe tratar de comprar el servidor con el número de tarjetas de red necesario, para ubica ubicarlas en las distintas redes a las cuales debe llegar para hacer backup. La idea finalmente, es que el tape library pueda aprovechar la velocidad de las tecnología actuales como FiberChannel y SAS que son de mejor desempeño que iSCSI SAS, iSCSI.
R ED L A N D A T O S

S e rvid ore s a R e s pa lda r

C o ne x ión Fib er C ha n ne l o iSC S I

S e rvid or d e B ac ku p
R ED SA N

C on e xió n S A S , F ib e r C ha n ne l o iS C S I C o ne x ión Fib er C ha n ne l o iSC S I

T a pe Lib rary

SA N

Figura No. 8 – Toplogía Mejorada para Backup (Cortés, 2011)

El propósito es evitar cuellos de botella, pero esto implica costos de inversión, así que todo depende del presupuesto y el alcance del proyecto. Se cual sea el caso, l ideal de lo la estrategia de backup es q el backup se envíe a disco primero, y desde allí se pase a que cinta. Esto último puede hacerse en cualquier momento del día ya que no afectaría las sto aplicaciones y la red.

TapeLibrary: Algunos lo llaman el robot de backup, para referirse al componente que backup, envía la información de disco a cinta, y generalmente se presentan: • • StandAlone = Equipo con un tape drive TapeLibrary = Equipo con uno o más tapedrives y con slots para albergar más de una cinta.

Un tapedrive es donde se introduce la cinta para su lectura o escritura, según sea el e caso. Vienen en diferentes marcas como Exabyte, Quantum, IBM, etc, de acuerdo a la ienen tecnología de Tape se utiliza las cintas con sus respectivas capacidades de utilizan almacenamiento, las cuales son seleccionadas de acuerdo al tamaño de l información , la a la cual se desea hacer backup. El tape debe poder conectarse ya sea por backup. FiberChannel, iSCSI o SAS, y poder ser administrado a través de un panel frontal o vía red (debe tener una interface vía red) red).

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 11 de 14)

Cuando se adquiere la solución de backup, debe asegurarse de que existe plena compatibilidad con el tape y debe poderse administrar a través de él. El tape library permite alojar más de una cinta y programar a consideración los procesos de backup sin recurrir a c cambios diarios de cinta, haciéndolo más automático. Un tape library puede tener más de un tapedrive o slot para leer y escribir la cinta, ayudando al paralelismo en proceso de backup y por ende a un mejor desempeño en la ventana de backup. La tecnología del tape library determina hasta qu punto se qué pueden leer tecnologías de medios antecesoras y la velocidad de lectura y escritura a cinta. Asi que cuando piense en elegir el tape library mire: • • • • • • • • Cuántos tape drive requiere. Cuántos slots para albergar cintas necesita. Con qué tecnología lo va a conectar (FC, iSCSI, SAS). Posibilidad de administrar vía red. Qué tecnología antecesoras soporta si es necesario. Tasa de lectura y escritura en la cinta. Qué tipo de garantía tiene el producto. El tipo de soporte.

SAN: Unidad de almacenamiento, donde el backup reside para finalmente ser pasado a cinta. Dado que la finalidad es almacenamiento de información no requiere discos de información, alto desempeño, por lo que se puede hablar de discos SATA de 10KRPM o de discos SATA de 7.2 KRPM, la cuestión allí es disminuir costos y no utilizar disco de alto disminuir desempeño para una tarea de solo almacenamiento. La SAN se dimensiona según los requerimientos o los paquetes mínimos que venden los fabricantes, como EMC. Debe poderse conectar al tapelibrary directamente por SAS, iSCSI o FC. La recomendación es que cuando se adquiera una, se puede tener la CSI , flexibilidad en almacenamiento sin perjudicar la disponibilidad del servicio. xibilidad A este respecto, fabricantes como DELL, EMC2, IBM, HP, tienen soluciones combinadas abricantes que integran SAN y NAS al tiempo, sin embargo para este caso se recomienda una solución en SAN nativa con LUNs que no superen los 10TB, por cuestiones de recuperabilidad o restauración de la in egridad de la LUN en caso de un daño. integridad

Control del proceso de backup Auditoría (ente supervisor de las buenas prácticas y controles) hace las siguientes ente recomendaciones en el control del proceso de backup. La intención es asegurar la recuperabilidad de la información en el momento en el cual se necesite, bien sea por operación diaria o por un DRP, lo que implica que se deban tener en cuenta los tener siguientes elementos que garanticen que se puede hacer hacer:

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 12 de 14)

1. Bitácora de backups: Es un archivo que debe contener: a. Hora inicio y hora fin del backup. b. Tipo de backups utilizado en el día a día. c. Logs del backups y su ubicación en otro servidor, en la bitácora debe haber los links apuntando a ese servidor. ndo d. Velocidad de backup por servidor. e. Cantidad de información grabada por servidor. f. Errores encontrados por servidor. contrados g. Total de cantidad de información de día. del h. Responsable de la revsión de los logs. i. Pruebas de restauración y logs donde quede constancia de la misma donde misma, indicando si fue o no exitosa. 2. Custodia de medios: Contrato con un tercero que debe tener: a. El cliente debe acordar y tener el contrato actualizado de la prestación de actualizado servicio. b. Debe quedar claro que el proveedor del servicio NO DEBE estar en capacida de extraer la información de los medios de almacenamiento que se le entreguen en custodia. c. Se debe definir la modalidad de custodia, si es por contenedor (un tamaño contenedor de caja y lo que se pueda meter allí, y sellada respectivamente) o si es por almacenamiento individual (cobran de forma individual cada medio). d. Debe estar claro los tiempos de respuesta y sus costos, incluso si la organización está por fuera del perímetro geográfico establecido como fuera estandar dentro de la cobertura del servicio. e. Debe existir una bitácora donde se estipule los simulacros donde se midieron los tiempos de respuesta contratados. f. El proveedor debe tener en custodia los medios en un sitio acordes a los estándaresinternacionales. g. El cliente debe establecer el personal y el lugar autorizado para la entrega y recepción de medios. h. Se debe definir la periodicidad en la entrega de medios para con el proveedor.

La bitácora es revisada p el auditor en su momento, pero para e operador de da por el backup, es una herramienta que le ayuda a dimensionar el crecimiento de la información y los requerimientos a futuro. Normalmente la bitácora se hace en un archivo de excel y debe soportar las decisiones y nuevos rumbos de la plataforma. decisiones La custodia de ciertos medios con un proveedor externo con ubicación geográfica diferente al de la organización, permite garantizar hasta cierto punto el Plan de Recuperación de Desastres (DRP). Es algo que las auditorías normalmente recomienda auditorías y revisan durante el proceso, como de los SLA (Service Level Agreement) establecidos dentro del contrato.

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 13 de 14)

Conclusiones El diseñar una plataforma de backup no es simplemente un cambio tecnológico, es una proceso estratégico para la organización y establecido o condicionado por la organización, y no por el área de TI. Todo debe estar contemplado en un documento formal que define las reglas y el fin del sistema y al cual se le llama Pol Políticas de Backup Organizacional, de acuerdo a ellas el sistema soporta las decisiones tom o madas. También es importante no tener “Todos los huevos en la misma canasta”, es decir que los medios de almacenamiento no deben estar físicamente y geográficamente en el mismo lugar donde está localizada la organización, porque auditoría revisa esta parte tanto la Auditoría Interna como la Auditoría Externa. La administración de una plataforma de backup puede ser tan comple que requiere eja, de un recurso humano de edicado a su supervisión y especializado en el tema, es una tarea del día a día y debe se la segunda en efectuarse durante el mism er mo.

Cómo diseñar un sistema de backup para su compañía by Fabian Cortés is licensed under a Creative Commons Reconocimiento Reconocimiento-NoComercial-SinObraDerivada 3.0 Unported License.

Ing. Fabian Leonardo Cortés Torres (2011)

(Página 14 de 14)

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->