Professional Documents
Culture Documents
Bases de datos
Redes de ordenadores
INTEGRACIN
Problemas derivados del desarrollo de BD independientes:
Consecuencias:
Inconsistencias en los otros datos Dificultad de interoperatividad Aislamiento de los distintos grupos de usuarios
Necesidad de los Sistemas de Informacin integrados que respondan a los objetivos globales de la empresa.
DISTRIBUCIN
Necesidad de Sistemas de Informacin Distribuidos que doten de autonoma a los usuarios y que consigan mayor eficiencia.
NO OBSTANTE.
DEFINICIONES
Coleccin de mltiples bases de datos, lgicamente interrelacionadas, distribuidas sobre una red de ordenadores.
BD DISTRIBUIDAS VS BD CENTRALIZADAS
BD LOCA L
ORDENAD OR SGBD D
BD LOCA L
ORDENAD OR SGBD D
ORDENAD OR SGBD D
BD LOCA L
ORDENAD OR SGBD D
BD LOCA L
Los datos deben estar fsicamente en ms de un ordenador (distintas sedes) Las sedes deben estar interconectadas mediante una red (cada sede es un nodo de la red) Los datos han de estar lgicamente integrados (recuperacin y actualizacin) tanto en local como remoto (esquema lgico global y nico) En una nica operacin se puede acceder (recuperar o actualizar) datos que se encuentran en ms de una sede (acceso a datos locales o remotos) Todas las acciones que necesiten realizarse sobre ms de una sede sern transparentes al usuario (transparencia de distribucin para el usuario)
ALMACENAMIENTO DISTRIBUIDO
RPLICA: copia de R en emplazamiento diferente FRAGMENTACIN: R dividida en fragmentos diferentes almacenados en sitios diferentes RPLICA Y FRAGMENTACIN: R dividida en fragmentos que son replicados en sitios diferentes
ORGANIZATIVAS:
Adaptacin a la organizacin de la institucin (unin de compaas/descentralizacin), respondiendo a cambios Almacenar los datos donde son generados y/o usados, la mayor parte locales Proporcionar autonoma local, controlndose desde cada nodo. Poltica general contra poltica local
ECONMICAS:
TCNICAS:
Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez Fiabilidad/disponibilidad, en un determinado momento / intervalo. Varios sitios, duplicaciones, evitan fallos Modularidad Mejora del rendimiento, BD ms pequeas, operaciones de menor volumen Crecimiento incremental, aadiendo poder de procesamiento y almacenamiento. Se pueden agregar computadoras adicionales a la red conforme aumentan el nmero de usuarios y su carga de procesamiento
Complejidad del sistema, desarrollo de software ms costoso, problemas de sincronizacin, dificultad para conocer la correccin de los algoritmos paralelos, deteccin de cadas de nodos Dependencia de la red de comunicaciones, sobrecarga de procesamiento de mensajes Dificultad de diseo, fases adicionales Poca madurez de los productos comerciales, orientados a replicacin Funciones de administracin compleja, sincronizacin y coordinacin Dificultad de cambio, inexistencia de metodologas Personal especializado
El rendimiento puede ser peor para el procesamiento distribuido que para el procesamiento centralizado. El procesamiento de base de datos distribuida puede resultar menos confiable que el procesamiento centralizado. Su mayor complejidad, a menudo se traduce en altos gastos de construccin y mantenimiento.
CRITERIOS DE DISEO
Se definieron 12 reglas:
Autonoma local 2. No depender de un sitio central 3. Operatoria continua 4. Independencia de la localidad 5. Independencia de la fragmentacin 6. Independencia de la replicacin 7. Procesamiento de querys distribuidas 8. Transacciones distribuidas 9. Independencia del hardware 10. Independencia del SO 11. Independencia de la red 12. Independencia de la base de datos
1.
Autonoma Local.
Es parte de un SD pero tambin atiende requerimientos locales. Todos los sitios son remotos. Cada sitio tiene su diccionario de datos y seguridad. Operatoria 7 x 24 Hot backup (es una copia efectuada en los datos aunque estn todava disponibles para los usuarios y pueden estar siendo actualizados.) El usuario final no conoce la localidad fsica. No hay diferencias de lugares especficos.
Operacin continua.
Horizontal Diferentes filas de la misma tabla se almacenan en diferentes sitios. Organizaciones con ramificaciones y las mismas tablas. Vertical Las columnas de la misma tabla se encuentran en sitios diferentes.
Problemas de disponibilidad (o dependencia) si se cae el nodo. No habra problemas si tenemos una base de datos distribuida replicada.
Independencia de rplica.
Habilidad de crear copias del master en sitios remotos. Llamados snapshots pueden contener TODO. Pueden replicarse como read-only y refresh definido. Es ms que ejecutar consultas sobre ms de una base. Se ejecuta en el nodo en la que est el usuario. Se particiona en sub-consultas.
Manejo del modificaciones a la desde una consulta simple. Se implementa con algoritmo two-phase commit
Asegura que todas las bases tienen xito en los subupdates anes del commit definitivo. Un fallo en una, hace fallar toda la transaccin.
Hay nuevas tcnicas que permiten commit parciales El query (consulta) obtiene informacin de un IBM, PC, MAC, etc.
El query (consulta) obtiene informacin de un WIN, UNX, MVS, etc Los diferentes protocolos no tienen efecto sobre la BDD. Soportan multiprotocolos.
EL SGBDD (I)
Propagacin de actualizaciones
Procesamiento de consultas distribuidas, definicin de estrategias Mantener un diccionario integrado Control de concurrencia, integridad de la BDD, consistencia entre las mltiples copias de los datos Fiabilidad de los SGBDD, capaz de recuperar y devolver a las bases de datos implicadas en el fallo un estado consistente y estable Soporte de sistema operativo Bases de datos heterogneas, mecanismos de traduccin
EL SGBDD (II)
Gestin de datos local Responsable de las funciones de distribucin Suministra las primitivas y los servicios de comunicaciones que necesita el PAD
Software de comunicaciones
Cada sede puede tener un PDL y un PAD o bien slo uno de ellos
SGBDD homogneos: todos los SGBD locales son iguales SGBDD heterogneos: los SGBD locales son distintos
SGBDD federados: total autonoma funcional (multibase de datos) SGBDD sin ninguna autonoma funcional local
DUDAS