Bases de datos Distribuidas Una base de datos distribuida (BDD) es un conjunto de bases de datos que están lógicamente relacionadas

, se encuentran distribuidas en diferentes espacios lógicos y están interconectadas por una red. Un sistema de Bases de Datos Distribuida (SBDD) es un sistema en el cual hay varias bases de datos en distintos lugares unidas por un sistema de comunicaciones y un usuario en cualquier lugar puede acceder a los datos como si fueran accedidos localmente Los principales factores que distinguen un SBDD de un sistema centralizado son los siguientes: o Hay múltiples nodos. o Los nodos están comunicados por medio de una red. Funcionalidades adicionales de un Sistema de Bases de Datos Distribuidas
o o o 

Accede a sitios remotos, transmite consultas y datos a través de varios lugares mediante una red de comunicación. Almacena el esquema de distribución y replicación de los datos en el catalogo del sistema. Establece las estrategias de ejecución de las consultas y las transacciones que acceden a los datos en más de un sitio.

Realiza la recuperación ante los fallos.

Las Doce Reglas de las Bases de Datos Distribuidas: El Principio fundamental de las bases de datos distribuidas es que para el usuario no debe existir diferencia entre un sistema distribuido y uno centralizado. o Autonomía Local: los sitios distribuidos deben ser autónomos, todas las operaciones en un sitio se controlan ahí mismo. o No dependencia de un sitio central: todos los sitios deben ser tratados igual por lo que no debe de haber dependencia de un sitio central para obtener un servicio. o Operación Continua: el sistema debe estar funcionando en todo momento. o Independencia con respecto a la localización: que los usuarios no tienen que saber dónde están almacenados físicamente los datos, debe comportarse como si estuvieran localmente. o Independencia con respecto a la fragmentación: Un sistema soporta la fragmentación de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento físico. La fragmentación es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicación donde son usados más frecuentemente para que la mayoría de las operaciones sean locales y se reduzca el tráfico en la red.

o Independencia con respecto al Sistema Operativo: es necesario no sólo tener la posibilidad de ejecutar el mismo DBMS en diferente hardware. o Mayor tolerancia a los fallos Desventajas o Es más complicado el control y la manipulación de los datos o Es compleja el aseguramiento de la integridad de la información en presencia de fallas no predecibles. Las réplicas Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) y pueden significar una mejor disponibilidad. o Manejo Distribuido de Transacciones: Existen dos aspectos principales en la administración de transacciones: control de recuperación y control de la concurrencia. o Nuevos nodos se pueden agregar fácil y rápidamente. . o réplicas. y es importante que se utilice una estrategia eficiente. sino también ejecutarlo en diferentes plataformas de sistema operativo. validez y exactitud de la información. Ventajas y Desventajas de los sistemas distribuidos Ventajas o El acceso a los datos es más rápido debido a que los datos se localizan más cercanos al lugar donde se utilizan. habrá muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud. o El control de concurrencia y los mecanismos de recuperación son mucho más complejos que en un sistema centralizado dado que los datos pueden estar replicados. La integridad se refiere a la consistencia. o La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una autonomía e independencia entre los nodos. o Independencia con respecto al equipo: Soporte para un gran número de máquinas diferentes. o Procesamiento Distribuido de Consultas: para una consulta que involucra a varios sitios. o Independencia con respecto a la red: El sistema debe poder ejecutarse en diferentes redes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una “imagen del sistema único”. La principal desventaja de las réplicas es que al actualizarlas es necesario actualizarlas todas. Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido Ya que una sola transacción puede involucrar la ejecución de código en muchos sitios. o El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo.o Independencia de réplica: El sistema soporta replicación de datos cuando un fragmento puede ser representado por muchas copias distintas. guardadas en varios sitios.

Costo de comunicación: Se debe considerar también el costo de las comunicaciones de la red para obtener data. Replicadas: el esquema de BDD de replicación consiste en que cada nodo debe tener su copia completa de la base de datos. pero también sacrifica la disponibilidad y fiabilidad de los datos. Fiabilidad de la data: Almacenando varias copias de la data en lugares geográficamente apartados se aumenta la probabilidad de que sea recuperable en caso de que ocurra daño físico. Esto se debe analizar cuidadosamente para determinar dónde poner la data. aún si el nodo al que usualmente acceden no está disponible o falla. Fragmentada: este modelo consiste en que solo hay una copia de cada elemento. fragmentada. Capacidades y costos de almacenamiento: los nodos pueden tener diferentes capacidades de almacenamiento y procesamiento. Este esquema tiene un alto costo en el almacenamiento de la información porque la actualización de los datos debe ser realizada en todas las copias.Distribución de los datos Al diseñar una base de datos distribuida debe tomarse en cuenta donde se colocara la data y que esquema se utilizara para esto. Centralizada: la forma centralizada es muy similar al modelo de Cliente/Servidor ya que la Base de datos se encuentra centralizada en un lugar y los usuarios están distribuidos. Esto disminuye el costo de almacenamiento. Criterios para escoger la distribución o o o o o Localidad de la data: la data debería debe estar donde más se accede. En cada nodo se encuentra uno o más fragmentos de la base de datos. Disponibilidad de la data: almacenar varias copias asegura que los usuarios tengan a su disponibilidad los elementos de la data. Se particiona la relación y a la vez los fragmentos están selectivamente replicados a través del sistema de BDD. El costo de almacenamiento se disminuye minimizando la cantidad de copias de la data. Estos disminuyen cuando cada sitio tiene su propia copia de la data. Existen cuatro formas de hacerlo: centralizada. Tiene la ventaja de tener el procesamiento distribuido pero no aporta mucho en la disponibilidad y fiabilidad de los datos. replicada. Híbrida: este esquema simplemente representa la combinación del esquema de fragmentación y replicación. e híbrida. . pero la información está distribuida a través de los nodos.

Sign up to vote on this title
UsefulNot useful