You are on page 1of 45

MATERIA:

Ing. Eleazar Pacheco Salazar

Acapulco, Gro. febrero 2015


1.1 Conceptos bsicos

1.2 objetivos de las bases de datos


distribuidas

1.3 disciplinas de estudio

1.4 Arquitectura de bases de datos


Introduccin
POR QUE SURGIERON LAS BDD?
Debido al crecimiento geogrfico de las organizaciones lo que significa
que una empresa pudiera tener diferentes sucursales, cada una de ellas
geogrficamente alejadas y tiene la necesidad de compartir
informacin.
Por la complejidad computacional; existen en la actualidad diferentes procesos
o problemas del mundo real difciles de resolver, y que implican el
consumo excesivo de recursos computacionales, de tal manera que no podran
ser solucionados por una computadora por lo que necesitara la unin de
varias, por ejemplo una sola computadora no sera capaz de realizar las
actividades de un cajero automtico en un estado.
1.1 DEFINICIN
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Un sistema de base de datos distribuida Es una base de datos almacenada en su


es un sistema en el cual mltiples sitios totalidad en un solo lugar fsico, es
de bases de datos estn ligados por decir, es una base de datos almacenada
un sistema de comunicaciones de tal en una sola mquina y una sola CPU, y
forma que, un usuario en cualquier sitio en donde los usuarios trabajan en
puede acceder a los datos en cualquier terminales tontas que slo muestran
parte de la red. resultados.
La diferencia principal entre los
sistemas de base de datos
centralizados y distribuidos es que,
en los centralizados, los
datos residen en una sola
localidad, mientras que, en los
distribuidos, se encuentran
en varias localidades.
Justificacin de la descentralizacin

Para permitir autonoma local y promover la


evolucin de los sistemas y los cambios en los
requerimientos de usuario.

Para proveer una arquitectura de sistemas simple,


flexible y tolerante a fallas.

Para ofrecer buenos rendimientos.


Retos de la distribucin de datos

Acceso entre sitios sea eficiente, presumiblemente ptima.


Transformar datos e integrar diferentes tipos de procesamiento
entre nodos de un ambiente distribuido.
Distribuir datos en los nodos del ambiente distribuido de una
manera ptima.
Controlar el acceso a los datos disponibles en el ambiente
distribuido.
Soportar la recuperacin de errores de diferentes mdulos del
sistema de manera segura y eficiente.
Asegurar que los sistemas locales y globales permanezcan como
una imagen fiel del mundo real evitando la interferencia
destructiva que pueden ocasionar diferentes transacciones en el
sistema.
Heterogeneidad y la presin para
integrar datos

La heterogeneidad se puede dar


a muchos niveles, desde la forma
La descentralizacin de la
y significado de cada dato hasta
informacin promueve la
el formato y el medio de
heterogeneidad en su manejo
almacenamiento que se elige
para guardarlo
En resumen en los sistemas de bases de datos
distribuidas:

Se persigue la integracin de sistemas de BD diversos no


necesariamente homogneos para dar a los usuarios una
visin global de la informacin disponible

Este proceso de integracin no implica la centralizacin de


la informacin

Los sistemas de bases de datos distribuidos permiten el


acceso a ella como si estuviera localizada en un solo lugar.
Computacin Distribuida
Control. Las
actividades
relacionadas con el
manejo o
administracin del
sistema.

Procesamiento lgico. Datos. La


Las tareas especficas
involucradas en una Elementos informacin
actividad de distribuibles que maneja el
procesamiento de
informacin. sistema.

Funciones. Las
actividades que
cada elemento
del sistema
realiza.
base de datos distribuida (BDD)

BDD
Conjunto de bases de datos

Lgicamente relacionadas

Distribuidas en diferentes

sitios interconectados por

una red de comunicaciones.


sistema de bases de datos distribuida (SBDD)

SBDD
Sistema en el cual mltiples
sitios de bases de datos
estn ligados por un sistema
de comunicaciones.

Un usuario en cualquier
sitio puede accesar los datos
en cualquier parte de la red
como si estuvieran
almacenados en su sitio.
sistema de manejo de bases de datos distribuidas
(SMBDD)

SMBDD
proporciona un mecanismo
de acceso que hace que la
distribucin sea transparente
a los usuarios.
El trmino transparente
significa que la aplicacin
trabajara, desde un punto
de vista lgico, como si un
solo SMBD ejecutado en una
sola mquina, administrara
esos datos.
Arquitectura de memoria compartida

Consisten de diversos procesadores los


cuales accesan una misma memoria y un
misma unidad de almacenamiento (uno o
varios discos).
Arquitectura de disco compartido

Consiste de diversos procesadores cada uno


de ellos con su memoria local pero
compartiendo una misma unidad de
almacenamiento (uno o varios discos).
Arquitectura nada compartido

Consiste de diversos procesadores cada uno


con su propia memoria y su propia unidad de
almacenamiento.
CARACTERISTICAS PRINCIPALES
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Permite que cada sitio almacene y Se almacena completamente en una


mantenga su propia BD. localidad central (mainframe o macro
computadora).
Mejora la fiabilidad si la computadora de
un sitio se cae. No posee mltiples elementos de
procesamiento ni mecanismos de
Permitir el control local de los datos en intercomunicacin.
un sitio mejora el grado de satisfaccin
de los usuarios con relacin al Los componentes de la Bases de
sistema de BD. Datos Centralizadas son: los datos, el
software del SGBD y los dispositivos de
Cuando cada sitio procesa sus datos almacenamiento secundario
locales se elimina un poco el trfico de asociados, como disco de
la red, pero si los sitios usan almacenamiento en lnea de la base de
frecuentemente datos almacenados en datos y cintas para las copias de
otros sitios las comunicaciones pueden seguridad.
convertirse en un cuello de botella.
1.2 OBJETIVOS
1. Autonoma local. Los sitios de un sistema distribuido deben ser autnomos.
2. No dependencia de un sitio central
3. Operacin continua. El sistema nunca debe apagarse.
4. Independencia de localizacin
5. Independencia de fragmentacin
6. Independencia de rplica
7. Procesamiento distribuido de consultas. Las consultas se pueden realizar
desde cualquier lugar.
8. Manejo distribuido de transacciones. Deben ser de manera segura e
independiente.
9. Independencia de equipo
10. Independencia de sistema operativo. Debe poder ser ejecutado por
diferentes sistemas operativos.
11. Independencia de red
12. Independencia de DBMS
VENTAJAS
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Confiabilidad o Disponibilidad. Se evita la redundancia.


Si falla un nodo, los nodos restantes En sistemas que no usan Bases de
pueden seguir funcionando. Si se Datos Centralizadas, cada aplicacin
duplican los datos, la transaccin tiene sus propios archivos privados o se
que necesite un determinado dato encuentran en diferentes localidades.
puede encontrarlo en cualquiera de Esto a menudo origina enorme
los diferentes nodos. redundancia en los datos almacenados,
as como desperdicio resultante del
La ventaja principal de compartir los espacio de almacenamiento.
datos por medio de la distribucin es
que cada localidad puede tener mejor Se evita la inconsistencia.
control de sus datos almacenados Ya que si un hecho especfico se
localmente. representa por una sola entrada, la no-
concordancia de datos no puede
ocurrir.
VENTAJAS
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Razones econmicas. Pueden hacerse cumplir las normas


Cuando se maximiza el acceso local de establecidas.
las aplicaciones a los datos se Con un control central de la base de
disminuye el trfico en las datos, el Administrador de Base de
comunicaciones. Datos (DBA) puede garantizar que se
cumplan todas las formas aplicables a la
Autonoma. representacin de los datos.
Cada nodo tiene cierto grado de control
sobre sus datos, en un Pueden aplicarse restricciones
sistema centralizado, hay un de seguridad.
administrador del sistema responsable El Administrador de Base de
de los datos a nivel global. Cada Datos (DBA) puede asegurar que el
administrador local puede tener un nivel nico medio de acceder la base de
de autonoma local diferente. datos sea a travs de los canales
establecidos.
Nuevos nodos se pueden agregar fcil y
rpidamente.
La comunicacin entre nodos se mejora.
Los costos de operacin se reducen.
Son amigables al usuario.
La probabilidad de que una falla en un solo nodo
afecte al sistema es baja.
Existe una autonoma
e independencia entre los nodos.
Los datos son localizados en lugar ms cercano,
El acceso es ms rpido.
El procesamiento es rpido debido a que varios
nodos intervienen en el procesamiento de una carga
de trabajo
DESVENTAJAS
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Coste de desarrollo del software. En caso de un desastre o catstrofe,


La complejidad aadida que es la recuperacin es difcil de sincronizar.
necesaria para mantener la coordinacin
entre nodos hace que el desarrollo de Los mainframes (computadora central)
software sea ms costoso. no ofrecen mejor proporcin
precio/rendimiento que los
Mayor probabilidad de errores. microprocesadores de los sistemas
Como los nodos que constituyen el distribuidos.
sistema funcionan en paralelo, es ms
difcil asegurar el funcionamiento Por lo general, cuando un sistema de
correcto de los algoritmos, as como de Base de Datos Centralizada falla, se
los procedimientos de recuperacin de pierde toda la disponibilidad de
fallos del sistema. procesamiento y sobre todo de la
informacin confiada al sistema.
DESVENTAJAS
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Mayor sobrecarga de procesamiento. Las cargas de trabajo no se pueden


El intercambio de mensajes y ejecucin difundir entre diferentes
de algoritmos para el mantenimiento de computadoras, ya que los trabajos
la coordinacin entre nodos supone siempre se ejecutarn en la misma
una sobrecarga que no se da en los mquina.
sistemas centralizados.
Un mainframe en comparacin con un
sistema distribuido no tiene mayor
poder de cmputo.

No se puede aadir poder de cmputo


en pequeos incrementos, debido a lo
complicado de esta operacin.
COSTOS
Los costos en los sistemas centralizados
Los sistemas centralizados, por razones de economa de escala, son
propios de aplicaciones de mucha memoria.
Los sistemas centralizados son propios de bases de datos que
requieren mnima redundancia de datos.
Los sistemas centralizados se requieren cuando hay que invertir menos
en recursos humanos.
La planeacin centralizada minimiza los costos.
Al hacer un mejor uso de los recursos, por el hecho de estar en un sitio,
los costos tienden a ser menores que en los sistemas distribuidos.
Los costos en los sistemas distribuidos
Los sistemas distribuidos tienen un menor costo en las
comunicaciones.
Hay un mejor uso de los recursos tecnolgicos, por el
aprovechamiento de los equipos existentes en los sitios.
COMPLEJIDAD
Se debe asegurar que la base de datos sea transparente. Ya que al disear la
base de datos se tiene que trabajar tomando en cuenta su naturaleza
distribuida, por lo cual no podemos pensar en hacer joins que afecten varios
sistemas.

Integridad en las bases de datos distribuidas


La aplicacin del concepto de transaccin se mantiene pero involucra un
trabajo ms complejo. Si hay dos sitios involucrados en una transaccin y uno
de ellos falla, hay dos posibilidades:
o Que la transaccin sea abortada
o Que haya un sistema inteligente que termine la transaccin
correctamente aunque los dos sitios no estn operando
simultneamente.
DISTRIBUCION Y CONTROL
Los departamentos de sistemas requieren mayor autonoma local.
En los departamentos de usuarios se fomenta la responsabilidad local.
Los usuarios aprenden a apreciar los costos de procesamiento.
La descentralizacin evita poner el poder en pocas manos.
Las estructuras son ms flexibles.
Tienen mejores interfaces de usuario, como por ejemplo las de los
sistemas cliente-servidor.
Presentan cierto grado de disponibilidad an en caso de falla.
Tienen un mejor tiempo de respuesta.
Las aplicaciones son ms adaptadas a las necesidades locales.
Los volmenes de procesamiento deben ser relativamente grandes a
nivel local.
Los usuarios comprenden mejor sus problemas.
Un grupo de soporte local reacciona ms rpido a las demandas locales.
Aprovechan la proliferacin de equipos.
SEGURIDAD
Deben preservar la atomicidad de las transacciones aun en casos de
fallas en algunos sitios involucrados.
La recuperacin debe hacerse basado en protocolos complejos de
compromiso en dos o en tres fases.
Asegurar la atomicidad de las transacciones distribuidas a travs de la
red.
Trabajar adecuadamente los bloqueos en cada uno de los sitios.
Los administradores locales tienen el mismo problema de vulnerabilidad
y privacidad de los administradores globales.
Por la autonoma de cada sitio, los propietarios de los datos tienen sus
propias protecciones, a veces buenas, a veces no tanto.
Las bases de datos distribuidas presentan los problemas intrnsecos a
los sistemas distribuidos ya que las redes representan un punto dbil en
proteccin.
como distribuir la informacin entre diferentes
sitios.

Problemas de eficiencia de acceso a la


informacin:

Como fragmentar la informacin.

Como asignar los fragmentos entre los


diferentes sitios de la red.
El objetivo es convertir transacciones de usuario en
instrucciones para manipulacin de datos.

Este problema de optimizacin es NP-difcil, por lo


que en tiempos razonables solo se pueden obtener
soluciones aproximadas.

En BDD se tiene que considerar el procesamiento


local de una consulta junto con el costo de
transmisin de informacin al lugar en donde se
solicit la consulta.
actividad de coordinar accesos concurrentes a la base de datos.

El control de concurrencia permite a los usuarios accesar la base de


datos en una forma multiprogramada mientras se preserva la ilusin
de que cada usuario est utilizndola solo en un sistema dedicado.

El control de concurrencia asegura que transacciones mltiples


sometidas por usuarios diferentes no interfieran unas con otras de
forma que se produzcan resultados incorrectos.

En BDD el control de concurrencia es an ms complejo que en


sistemas centralizados.
Manejo transparente de datos distribuidos, fragmentados y replicados.

Comercialmente an no se soporta la replicacin de


informacin.

La fragmentacin utilizada es nicamente de tipo


horizontal .

La distribucin de informacin no se realiza an con la


transparencia requerida.
Mejoramiento de la confiabilidad y disponibilidad de la
informacin mediante transacciones distribuidas.

Algunos sistemas como Ingres, Non Stop SQL y Oracle V


7.x ofrecen el soporte de transacciones distribuidas.

En Sybase, por ejemplo, es posible tener transacciones


distribuidas pero stas deber ser implementadas en las
aplicaciones mediante primitivas dadas.

Respecto del soporte para replicacin de informacin o


no se ofrece o se hace a travs de la regla une-lee-todos-
escriben.
se debe ofrecer garantas de que la informacin es confiable.

. En sistemas distribuidos, el manejo de la atomicidad y durabilidad


de las transacciones es an ms complejo.

una sola transaccin puede involucrar dos o ms sitios de la red.

el control de recuperacin en sistemas distribuidos debe asegurar


que el conjunto de agentes que participan en una transaccin
realicen todos un compromiso (commit) al unsono o todos al mismo
tiempo restablezcan la informacin anterior (roll-back).
Mejoramiento de la eficiencia.

la ubicacin de los datos a lugares prximos a donde se usan puede mejorar


la eficiencia en el acceso a la informacin.

para lograrlo es necesario tener un buen soporte para fragmentacin y


replicacin de informacin.

Otro punto en donde se puede incrementar la eficiencia es mediante la


explotacin del paralelismo entre operaciones.

Especialmente en el caso de varias consultas independientes, stas se


pueden procesar por sitios diferentes. Ms an, el procesamiento de una sola
consulta puede involucrar varios sitios y as procesarse de manera ms rpida.

Sin embargo, la explotacin del paralelismo requiere que se tenga tanta


informacin requerida por cada aplicacin en el sitio donde la aplicacin se
utiliza, lo cual conducira a una replicacin completa, esto es, tener toda la
informacin en cada sitio de la red.
Mejor escalabilidad de las BD.

El tener sistemas escalables de manera fcil y econmica


se ha logrado por el desarrollo de la tecnologa de
microprocesadores y estaciones de trabajo.

Sin embargo, respecto de la escalabilidad, la comunicacin


de la informacin tiene un costo el cual no se ha estudiado
con suficiente profundidad.
Cualquier organizacin que tiene una
estructura descentralizada. (organismos
gubernamentales y/o de servicio pblico)

La industria de la manufactura,
particularmente, aquella con plantas
mltiples. Por ejemplo, la industria
automotriz.

Aplicaciones de control y comando


militar.
Lneas de transportacin area.

Cadenas hoteleras.

Servicios bancarios y financieros.


EJEMPLOS PRACTICOS
BASES DE DATOS DISTRIBUIDAS BASES DE DATOS CENTRALIZADAS

Los bancos utilizan BD distribuidas. SIABUC es un sistema que permite la


clasificacin ordenada de Bibliografa.

Las Terminales de Autobuses.


1.4 Arquitectura de bases de datos

Arquitectura ANSI/SPARC de una base de datos.

Arquitectura de un SMBDD homogneo.


Arquitectura de un sistema multi-bases de datos.

Arquitectura de los esquemas de un SMBDD


homogneo
Arquitectura basada en componentes de un
SMBD distribuido.
Arquitectura basada en componentes de un
sistema multi-bases de datos

You might also like