Professional Documents
Culture Documents
INTRODUCCION
La replicacin de datos permite que ciertos datos de la base de datos sean almacenados en ms de un sitio, y su principal utilidad es que permite aumentar la disponibilidad de los datos y mejora el funcionamiento de las consultas globales a la base de datos. [Elm00] La replicacin en SQL Server consiste, en el transporte de datos entre dos o ms instancias de servidores. Para ello SQL Server brinda un conjunto de soluciones que permite copiar, distribuir y posiblemente modificar datos de toda la organizacin. Se incluyen, adems, varios mtodos y opciones para el diseo, implementacin, supervisin y administracin de la replicacin, que le ofrecen la funcionalidad y flexibilidad necesarias para distribuir datos y mantener su coherencia. En la replicacin se utiliza una metfora de la industria de la publicacin para representar los componentes y procesos de una topologa de replicacin. De esta forma el modelo se compone, bsicamente, de los siguientes elementos: publicador, distribuidor, suscriptores, publicaciones, artculos y suscripciones.
W. Curtis Preston
Qu es la tecnologa de replicacin de datos y cmo funciona?
La replicacin es el proceso de copia de datos de un alojador a otro por bloques y de forma diferencial. Por lo tanto, como la replicacin se suele llevar a cabo a nivel de archivo o de libro, a medida que cambian cosas en el libro en cuestin, los bloques que han cambiado en la fuente se replican inmediatamente en el destino.
Cada una tiene sus ventajas e inconvenientes en distintos supuestos. La replicacin sncrona tiene la ventaja de estar continuamente actualizada en la sede de destino.
La ventaja de la replicacin asncrona es que, sea cual sea el ancho de banda o la latencia, no incide en el rendimiento de la aplicacin primaria. El inconveniente de la replicacin asncrona es que se puede desincronizar de la aplicacin primaria, y en realidad se puede desincronizar tanto que no alcance nunca a ponerse al da. Algunos productos tienen la capacidad de funcionar en modos especiales para intentar ponerse al da, pero si no se tiene ancho de banda suficiente o si se tiene demasiada latencia, se puede quedar uno tan atrs que no se cumple el objetivo de punto de restauracin (RPO), que es el inters fundamental de la replicacin.
Conceptos Universales
Replicacin:
La replicacin es el proceso de copiar y mantener actualizados los datos en varios nodos de bases de datos ya sean estos persistentes o no. ste usa un concepto donde existe un nodo amo o maestro (master) y otros sirvientes o esclavos (slaves). Es un conjunto de tecnologas destinadas a la copia y distribucin de datos y objetos de base de datos desde una base de datos a otra, para luego sincronizar ambas bases de datos y mantener su coherencia. La replicacin permite distribuir datos entre diferentes ubicaciones y entre usuarios remotos o mviles mediante redes locales y de rea extensa, conexiones de acceso telefnico, conexiones inalmbricas e Internet.
Beneficios:
Rendimiento: Normalmente y dependiendo del caso, hay ms lectura que escritura en una base de datos, por lo que tener varios nodos solo procesando la lectura puede traer un gran beneficio de rendimiento en una base de datos muy consultada. Prueba de fallas: Un esclavo estando casi sincrnicamente actualizado puede ser til en caso de que el nodo maestro caiga, este puede reemplazarlo y as no detener el servicio. Fiabilidad: Muchas veces se puede tener una replicacin para tener la seguridad de que los datos estn siendo copiados a otro nodo, en caso de sufrir un desperfecto en el maestro. Generacin de bloqueos: aunque esta es ms precisa, tambin se puede usar para procesos que necesiten leer datos, generando bloqueos, al hacerlo sobre un esclavo esto no interviene en el funcionamiento de todo el sistema, es muy usado para por ejemplo, hacer copias de seguridad, o extraer grandes cantidades de datos para generar estadsticas.
Replicacin en rbol:
En muchos casos, los esclavos tambin pueden tener sus propios esclavos, por lo que se puede generar rboles de replicacin, bajando la carga al maestro y dando la posibilidad de disear mejores modelos contra cadas de servicios. Las soluciones para integracin de datos necesitan soportar requerimientos claves de negocios como toma de decisiones en tiempo real, efectividad operacional y rentabilidad. Cambios, como el crecimiento exponencial de datos, expansin global del negocio y ambientes de mltiples bases de datos que requieren de soluciones de integracin de datos que sean flexibles, fcil de usar por el equipo humano de TI existente y que pueda ser implementado rpidamente para resultados mensurables.
Caractersticas y Beneficios
Caractersticas Claves Mirroring en tiempo real basado sobre logs de transacciones Beneficios Toma de decisiones mas precisa
Asistentes grficos
Funcionalidades incorporadas, con extensivas funciones personalizadas Creacin de tablas automtica en el destino Accesibilidad remota a la consola de administracin Managment Center
Conveniente administracin
Fig.1 Publicador-Distribuidor
Fig.2 Distribuidor-Suscriptor
Tipos de replicacin
Replicacin de instantneas
En la replicacin de instantneas los datos se copian tal y como aparecen exactamente en un momento determinado. Por consiguiente, no requiere un control continuo de los cambios. Las publicaciones de instantneas se suelen replicar con menos frecuencia que otros tipos de publicaciones. Puede llevar ms tiempo propagar las modificaciones de datos a los suscriptores. Se recomienda utilizar: cuando la mayora de los datos no cambian con frecuencia; se replican pequeas cantidades de datos; los sitios con frecuencia estn desconectados y es aceptable un periodo de latencia largo (la cantidad de tiempo que transcurre entre la actualizacin de los datos en un sitio y en otro). En ocasiones se hace necesario utilizarla cuando estn involucrados algunos tipos de datos (text, ntext, e image) cuyas modificaciones no se registran en el registro de transacciones y por tanto no se pueden replicar utilizando la metodologa de replicacin transaccional.
Replicacin transaccional
En este caso se propaga una instantnea inicial de datos a los suscriptores, y despus, cuando se efectan las modificaciones en el publicador, las transacciones individuales se propagan a los suscriptores. SQL Server 2000 almacena las transacciones que afectan a los objetos replicados y propaga esos cambios a los suscriptores de forma continua o a intervalos programados. Al finalizar la propagacin de los cambios, todos los suscriptores tendrn los mismos valores que el publicador. Suele utilizarse cuando: se desea que las modificaciones de datos se propaguen a los suscriptores, normalmente pocos segundos despus de producirse; se necesita que las transacciones sean atmicas, que se apliquen todas o ninguna al suscriptor; los suscriptores se conectan en su mayora al publicador; su aplicacin no puede permitir un periodo de latencia largo para los suscriptores que reciban cambios.
Replicacin de mezcla
Permite que varios sitios funcionen en lnea o desconectados de manera autnoma, y mezclar ms adelante las modificaciones de datos realizadas en un resultado nico y uniforme. La instantnea inicial se aplica a los suscriptores; a continuacin SQL Server 2000 hace un seguimiento de los cambios realizados en los datos publicados en el publicador y en los suscriptores. Los datos se sincronizan entre los servidores a una hora programada o a peticin. Las actualizaciones se realizan de manera independiente, sin protocolo de confirmacin, en ms de un servidor, as el publicador o ms de un suscriptor pueden haber actualizado los mismos datos. Por lo tanto, pueden producirse conflictos al mezclar las modificaciones de datos. Cuando se produce un conflicto, el Agente de mezcla invoca una resolucin para determinar qu datos se aceptarn y se propagarn a otros sitios. Es til cuando: varios suscriptores necesitan actualizar datos en diferentes ocasiones y propagar los cambios al publicador y a otros suscriptores; los suscriptores necesitan recibir datos, realizar cambios sin conexin y sincronizar ms adelante los cambios con el publicador y otros suscriptores; el requisito de periodo de latencia de la aplicacin es largo o corto; la autonoma del sitio es un factor crucial.
Conclusiones:
La replicacin de datos consiste en el transporte de datos entre dos o ms servidores, permitiendo que ciertos datos de la base de datos estn almacenados en ms de un sitio, y as aumentar la disponibilidad de los datos y mejorar el rendimiento de las consultas globales. El modelo de replicacin est formado por: publicador, distribuidor, suscriptor, publicacin, artculo y suscripcin; y varios agentes responsabilizados de copiar los datos entre el publicador y el suscriptor. A los tipos bsicos de replicacin (de instantneas, transaccional y de mezcla), se le incorporan opciones para ajustarse an ms a los requerimientos del usuario. La replicacin es muy til para mejorar la disponibilidad de datos, lo cual pudiera llevarse al caso extremo, conocido como bases de datos distribuidas replicadas totalmente, en el cual consiste en la replicacin de la base de datos completa en cada sitio en el sistema distribuido y garantiza notablemente la disponibilidad de datos, pues el sistema puede continuar operando cuando exista en servicio al menos uno de los servidores SQL Server. La desventaja es un alto costo para mantener la consistencia de las copias en cada sitio.
AUTORES:
RUIZ LEABO JOSE MERCEDES CHAPILLIQUEN CORNEJO BABY