You are on page 1of 28

REPLICACION DE DATOS

INTRODUCCION
La replicacin de datos permite que ciertos datos de la base de datos sean almacenados en ms de un sitio, y su principal utilidad es que permite aumentar la disponibilidad de los datos y mejora el funcionamiento de las consultas globales a la base de datos. [Elm00] La replicacin en SQL Server consiste, en el transporte de datos entre dos o ms instancias de servidores. Para ello SQL Server brinda un conjunto de soluciones que permite copiar, distribuir y posiblemente modificar datos de toda la organizacin. Se incluyen, adems, varios mtodos y opciones para el diseo, implementacin, supervisin y administracin de la replicacin, que le ofrecen la funcionalidad y flexibilidad necesarias para distribuir datos y mantener su coherencia. En la replicacin se utiliza una metfora de la industria de la publicacin para representar los componentes y procesos de una topologa de replicacin. De esta forma el modelo se compone, bsicamente, de los siguientes elementos: publicador, distribuidor, suscriptores, publicaciones, artculos y suscripciones.

W. Curtis Preston
Qu es la tecnologa de replicacin de datos y cmo funciona?
La replicacin es el proceso de copia de datos de un alojador a otro por bloques y de forma diferencial. Por lo tanto, como la replicacin se suele llevar a cabo a nivel de archivo o de libro, a medida que cambian cosas en el libro en cuestin, los bloques que han cambiado en la fuente se replican inmediatamente en el destino.

Cul es la diferencia entre replicacin sncrona y replicacin asncrona?


La tecnologa de replicacin sncrona no reconoce el asiento de la aplicacin primaria hasta que se ha replicado el bloque en la sede de destino. La replicacin asncrona, en cambio, primero reconoce el asiento y luego replica el bloque al cabo del tiempo.

Cada una tiene sus ventajas e inconvenientes en distintos supuestos. La replicacin sncrona tiene la ventaja de estar continuamente actualizada en la sede de destino.
La ventaja de la replicacin asncrona es que, sea cual sea el ancho de banda o la latencia, no incide en el rendimiento de la aplicacin primaria. El inconveniente de la replicacin asncrona es que se puede desincronizar de la aplicacin primaria, y en realidad se puede desincronizar tanto que no alcance nunca a ponerse al da. Algunos productos tienen la capacidad de funcionar en modos especiales para intentar ponerse al da, pero si no se tiene ancho de banda suficiente o si se tiene demasiada latencia, se puede quedar uno tan atrs que no se cumple el objetivo de punto de restauracin (RPO), que es el inters fundamental de la replicacin.

En qu difiere la replicacin asncrona de la replicacin peridica?


Tcnicamente, la replicacin peridica es un subconjunto de una de las maneras de realizar replicacin asncrona, en la medida en que como asncrono significa precisamente que no se est forzando el reconocimiento del asiento antes de reconocer el contra asiento en la aplicacin primaria. La replicacin peridica significa que se toma una instantnea en un momento determinado, normalmente cada hora. Con la replicacin asncrona, dependiendo de lo actualizado que se est, se est copiando continuamente todo, incluida la corrupcin. Si por ejemplo borrara accidentalmente una tabla, podra sobrescribir el destino con esa corrupcin.

Qu relacin hay entre replicacin y duplicacin de datos?


Estn relacionadas en la medida en que con la duplicacin de datos, puede usted replicar cosas que antes no poda. Histricamente, la replicacin se realizado a nivel de libro o de archivo. Se replica un libro, archivo o base en su ubicacin primaria. Despus, si se guarda esa base de datos a una matriz de discos, y luego se replica esa matriz de discos sin duplicacin, se estara replicando una cantidad de datos significativamente mayor que si se replicara desde el origen. La duplicacin permite guardar esos datos en disco utilizando metodologas de duplicacin, y luego, como la duplicacin en realidad elimina los bloques redundantes, permite replicar esa guarde a otra ubicacin. Algo que hasta ahora, slo era posible en los entornos ms reducidos.

Conceptos Universales
Replicacin:
La replicacin es el proceso de copiar y mantener actualizados los datos en varios nodos de bases de datos ya sean estos persistentes o no. ste usa un concepto donde existe un nodo amo o maestro (master) y otros sirvientes o esclavos (slaves). Es un conjunto de tecnologas destinadas a la copia y distribucin de datos y objetos de base de datos desde una base de datos a otra, para luego sincronizar ambas bases de datos y mantener su coherencia. La replicacin permite distribuir datos entre diferentes ubicaciones y entre usuarios remotos o mviles mediante redes locales y de rea extensa, conexiones de acceso telefnico, conexiones inalmbricas e Internet.

Beneficios:
Rendimiento: Normalmente y dependiendo del caso, hay ms lectura que escritura en una base de datos, por lo que tener varios nodos solo procesando la lectura puede traer un gran beneficio de rendimiento en una base de datos muy consultada. Prueba de fallas: Un esclavo estando casi sincrnicamente actualizado puede ser til en caso de que el nodo maestro caiga, este puede reemplazarlo y as no detener el servicio. Fiabilidad: Muchas veces se puede tener una replicacin para tener la seguridad de que los datos estn siendo copiados a otro nodo, en caso de sufrir un desperfecto en el maestro. Generacin de bloqueos: aunque esta es ms precisa, tambin se puede usar para procesos que necesiten leer datos, generando bloqueos, al hacerlo sobre un esclavo esto no interviene en el funcionamiento de todo el sistema, es muy usado para por ejemplo, hacer copias de seguridad, o extraer grandes cantidades de datos para generar estadsticas.

Replicacin en rbol:
En muchos casos, los esclavos tambin pueden tener sus propios esclavos, por lo que se puede generar rboles de replicacin, bajando la carga al maestro y dando la posibilidad de disear mejores modelos contra cadas de servicios. Las soluciones para integracin de datos necesitan soportar requerimientos claves de negocios como toma de decisiones en tiempo real, efectividad operacional y rentabilidad. Cambios, como el crecimiento exponencial de datos, expansin global del negocio y ambientes de mltiples bases de datos que requieren de soluciones de integracin de datos que sean flexibles, fcil de usar por el equipo humano de TI existente y que pueda ser implementado rpidamente para resultados mensurables.

Caractersticas y Beneficios
Caractersticas Claves Mirroring en tiempo real basado sobre logs de transacciones Beneficios Toma de decisiones mas precisa

Replicacin modo Refresh

Fcil, e instantnea entrega de datos


Mantiene dos bases de datos sincronizadas Servidor de Bases de Datos mantiene la estabilidad Rpida y fcil instalacin y configuracin Detallado control de transformaciones Rpido despliegue de datos

Modo Sincronizacin No necesita programacin

Asistentes grficos

Completa adaptacin va scripting

Funcionalidades incorporadas, con extensivas funciones personalizadas Creacin de tablas automtica en el destino Accesibilidad remota a la consola de administracin Managment Center

Conveniente administracin

Componentes del modelo de replicacin


La replicacin de datos es un asunto exclusivamente entre servidores de datos, en nuestro caso hablamos de servidores SQL Server. Los servidores SQL Server pueden desempear uno o varios de los siguientes roles: publicador, distribuidor o suscriptor.

Escenarios tpicos de la replicacin


Variando la ubicacin del servidor distribuidor podramos contar con las siguientes variantes:

Fig.1 Publicador-Distribuidor

Fig.2 Distribuidor-Suscriptor

Fig. 3 Distribuidor independiente

Tipos de replicacin

Los tipos bsicos de replicacin son:


replicacin de instantneas replicacin transaccional replicacin de mezcla

Replicacin de instantneas
En la replicacin de instantneas los datos se copian tal y como aparecen exactamente en un momento determinado. Por consiguiente, no requiere un control continuo de los cambios. Las publicaciones de instantneas se suelen replicar con menos frecuencia que otros tipos de publicaciones. Puede llevar ms tiempo propagar las modificaciones de datos a los suscriptores. Se recomienda utilizar: cuando la mayora de los datos no cambian con frecuencia; se replican pequeas cantidades de datos; los sitios con frecuencia estn desconectados y es aceptable un periodo de latencia largo (la cantidad de tiempo que transcurre entre la actualizacin de los datos en un sitio y en otro). En ocasiones se hace necesario utilizarla cuando estn involucrados algunos tipos de datos (text, ntext, e image) cuyas modificaciones no se registran en el registro de transacciones y por tanto no se pueden replicar utilizando la metodologa de replicacin transaccional.

Replicacin transaccional
En este caso se propaga una instantnea inicial de datos a los suscriptores, y despus, cuando se efectan las modificaciones en el publicador, las transacciones individuales se propagan a los suscriptores. SQL Server 2000 almacena las transacciones que afectan a los objetos replicados y propaga esos cambios a los suscriptores de forma continua o a intervalos programados. Al finalizar la propagacin de los cambios, todos los suscriptores tendrn los mismos valores que el publicador. Suele utilizarse cuando: se desea que las modificaciones de datos se propaguen a los suscriptores, normalmente pocos segundos despus de producirse; se necesita que las transacciones sean atmicas, que se apliquen todas o ninguna al suscriptor; los suscriptores se conectan en su mayora al publicador; su aplicacin no puede permitir un periodo de latencia largo para los suscriptores que reciban cambios.

Replicacin de mezcla
Permite que varios sitios funcionen en lnea o desconectados de manera autnoma, y mezclar ms adelante las modificaciones de datos realizadas en un resultado nico y uniforme. La instantnea inicial se aplica a los suscriptores; a continuacin SQL Server 2000 hace un seguimiento de los cambios realizados en los datos publicados en el publicador y en los suscriptores. Los datos se sincronizan entre los servidores a una hora programada o a peticin. Las actualizaciones se realizan de manera independiente, sin protocolo de confirmacin, en ms de un servidor, as el publicador o ms de un suscriptor pueden haber actualizado los mismos datos. Por lo tanto, pueden producirse conflictos al mezclar las modificaciones de datos. Cuando se produce un conflicto, el Agente de mezcla invoca una resolucin para determinar qu datos se aceptarn y se propagarn a otros sitios. Es til cuando: varios suscriptores necesitan actualizar datos en diferentes ocasiones y propagar los cambios al publicador y a otros suscriptores; los suscriptores necesitan recibir datos, realizar cambios sin conexin y sincronizar ms adelante los cambios con el publicador y otros suscriptores; el requisito de periodo de latencia de la aplicacin es largo o corto; la autonoma del sitio es un factor crucial.

Factores para elegir el mtodo de replicacin a utilizar


Dentro de los factores relacionados con los requerimientos de la aplicacin, los fundamentales son: Autonoma Consistencia transaccional Latencia

Autonoma, consistencia transaccional y latencia


La autonoma de un sitio da la medida de cuanto puede operar el sitio desconectado de la base de datos publicadora. La consistencia transaccional de un sitio viene dado por la necesidad de ejecutar o no inmediatamente todas las transacciones que se han ejecutado en el servidor, o si es suficiente con respetar el orden de las mismas. La latencia de un sitio se refiere al momento en que se deben de sincronizar las copias de los datos. Necesitan los datos estar el 100% en sincrona? O si es admisible determinada latencia de qu tamao es aceptable el rezago? .

Conclusiones:
La replicacin de datos consiste en el transporte de datos entre dos o ms servidores, permitiendo que ciertos datos de la base de datos estn almacenados en ms de un sitio, y as aumentar la disponibilidad de los datos y mejorar el rendimiento de las consultas globales. El modelo de replicacin est formado por: publicador, distribuidor, suscriptor, publicacin, artculo y suscripcin; y varios agentes responsabilizados de copiar los datos entre el publicador y el suscriptor. A los tipos bsicos de replicacin (de instantneas, transaccional y de mezcla), se le incorporan opciones para ajustarse an ms a los requerimientos del usuario. La replicacin es muy til para mejorar la disponibilidad de datos, lo cual pudiera llevarse al caso extremo, conocido como bases de datos distribuidas replicadas totalmente, en el cual consiste en la replicacin de la base de datos completa en cada sitio en el sistema distribuido y garantiza notablemente la disponibilidad de datos, pues el sistema puede continuar operando cuando exista en servicio al menos uno de los servidores SQL Server. La desventaja es un alto costo para mantener la consistencia de las copias en cada sitio.

AUTORES:
RUIZ LEABO JOSE MERCEDES CHAPILLIQUEN CORNEJO BABY

You might also like