You are on page 1of 55

Bases de Datos Distribuidas

MC Beatriz Beltrn Martnez


Benemrita Universidad Autnoma de Puebla

Introduccin
El desarrollo y uso de sistemas de bases de datos distribuidas son promovidos principalmente por la creciente dispersin de las operaciones de negocios y el avance tecnolgico (redes). Aunque la dispersin de la BD en un sistema de BDD requiere de un DBMS ms complejo el usuario final no debe preocuparse por al complejidad operativa.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 168

Introduccin
El sistema de administracin de bases de datos distribuidas (DDBMS) la trata como una sola base de datos lgica. Los conceptos de diseo bsico siguen vlidos, pero la complejidad del manejo de los datos y distribucin no necesita ser conocida por el usuario final.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 169

Historia
Un DDBMS rige el almacenamiento y procesamiento de datos lgicamente relacionados a travs de un sistema de computadoras interconectadas, donde los datos y procesamiento esta distribuido. En los 70s las corporaciones ejercen sistemas de administracin de BD centralizados. Se usa un mainframe y el acceso se realiza por terminales no inteligentes.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 170

Historia
Se inician el modelo relacional, pero no tena resultados aceptables como el modelo jerrquico o el de red. En los 80s, se tienen cambios, entre los cuales se tiene:
Operaciones descentralizadas y acceso mltiple. Demanda de los clientes . Redes tipo LAN. Compartir datos resulta atractivo.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 171

Historia
La informacin se ve ms dinmica y las operaciones son necesariamente rpidas. En los 90s, estos factores se incrementaron y hay influencia de:
Incremento del WWW. Almacenes de datos. Mejor desempeo. Seguridad.
FCC BUAP Verano 2011 172

MC Beatriz Beltrn Martnez

Ventajas
Los datos se localizan cerca del sitio de mayor demanda. Acceso ms rpido a los datos. Procesamiento ms rpido de los datos. Facilitacin de crecimiento. Comunicacin mejorada. Costos de operacin reducidos. Interface de usuario fcil de usar. Menos peligro de falla en un sitio. Independencia de procesador.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 173

Desventajas
Complejidad del manejo y control. Seguridad. Falta de estndares, protocolos de comunicacin a nivel de base de datos. Requerimientos de almacenamiento incrementados (menor problema). Mayor dificultad en el manejo del ambiente de datos. Altos costos de entrenamiento.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 174

Definicin
El procesamiento distribuido, comparte el procesamiento lgico de la BD entre dos o ms sitios fsicamente independientes conectados mediante una red. Una base de datos distribuida guarda una BD lgicamente relacionada en dos o ms sitios fsicamente independientes. La BD se compone de varias partes conocidas como fragmentos de la Base de Datos.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 175

Definicin
Procesamiento distribuido:
Computadora A

DBMS Sitio 1

BD

Sitio 2

Red Sitio 3

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

176

Definicin
Computadora A

BD Distribuida

DBMS

F1

Red
Computadora B Computadora C

DBMS

DBMS

F2
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011

F3
177

Componentes
Estaciones de sistema de red. trabajo que formen el
El DDBS debe ser independiente del hardware.

Componentes de hardware y software residentes en las estaciones de trabajo.


Los componentes de red permiten el intercambio. Es deseable que las funciones de la DDB puedan ejecutarse en diferentes plataformas.

Medios de comunicacin que transporten los datos de una estacin a otra.

El DDBMS debe de ser independiente de los medios de comunicacin.


FCC BUAP Verano 2011 178

MC Beatriz Beltrn Martnez

Componentes
El procesador de transacciones (TP) es un componente de software encontrado en cada computadora que solicita datos.
El procesador recibe y procesa las solicitudes de datos de la aplicacin. El TP tambin se le conoce como procesador de aplicaciones (AP) o administrador de transacciones (TM).

El procesador de datos (DP) es el componente de software residente en cada computadora que guarda y recupera datos localizados en el sitio.
El DP tambin se le llama administrador de datos (DM).
FCC BUAP Verano 2011 179

MC Beatriz Beltrn Martnez

Componentes
Cada procesador de transacciones puede accesar datos en cualquier procesador de datos y cada procesador de datos maneja todas las solicitudes de datos locales de cualquier procesador de transacciones.
MC Beatriz Beltrn Martnez

TP

TP

TP DP

DP

Red
TP DP TP DP DP

FCC BUAP

Verano 2011

180

Componentes
Los protocolos DDBS: determinan como el

Se comunicar con la red para transportar datos y comandos entre los DP y TP. Sincronizar todos los datos recuperados de los DP y los encauzar a los TP apropiados. Garantizar funciones de BD comunes en un sistema distribuido, incluyendo seguridad, concurrencia, el control, respaldos y recuperacin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 181

Niveles
Niveles de Distribucin de los Datos y Procesos
Datos en un sitio Procesamiento en un sitio DBMS anfitrin Mainframe Datos en mltiples sitios

No aplicable
DDBMS Cliente / Servidor Totalmente distribuido
182

Procesamiento en mltiples sitios

Servidor de archivo DBMS Cliente / Servidor


FCC BUAP

MC Beatriz Beltrn Martnez

Verano 2011

Niveles
Procesamiento en un sitio y datos en un sitio (SPSD). Todo el procesamiento se realiza en un solo CPU o mainframe y todos los datos se guardan en el disco local de la computadora anfitriona. El procesamiento no puede ser realizado del lado del usuario del sistema. El DBMS est localizado en la computadora anfitriona, la cual es accesada por terminales no inteligentes conectadas a ella. Procesamiento en sitios mltiples, datos en un solo sitio (MPSD) Es en el que se realizan procesos mltiples en diferentes computadoras que comparten un solo depsito de datos.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 183

Niveles
En general, el escenario MPSD requiere un servidor de archivos de red que ejecuta aplicaciones convencionales que son accesadas mediante una LAN. Muchas aplicaciones de contabilidad para usuarios mltiples, que funcionan en una red de computadoras personales, encajan en esa opcin. Procesamiento en sitios mltiples, datos en sitios mltiples (MPMD) Describe un sistema de administracin de BD totalmente distribuida con soporte para mltiples procesadores de datos y de transacciones en diversos sitios.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 184

Niveles
Segn el soporte de diferentes tipos de DBMS centralizados, los DDBMS se clasifican como homogneos o heterogneos. Los DDBS homogneos integran slo un tipo de DBMS centralizado a travs de una red. Por lo tanto, el mismo DBMS se ejecutar en diferentes mainframes. Por el contrario los DDBS heterogneos integran diferentes tipos de DBMS centralizados a travs de una red. Un DDBMS totalmente heterogneo soportar diferentes DBMS que, incluso pueden soportar diferentes modelos de datos que funcionan en diferentes sistemas de cmputo.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 185

Transparencia
Las caractersticas de transparencia del DDBMS son caractersticas funcionales y tienen la propiedad comn de permitir que el usuario sienta que es el nico que est utilizando la base de datos. Las caractersticas de transparencia del DDBMS son: Transparencia de distribucin, la cual permite que una DDB sea tratada como una sola base de datos lgica. Si un DDBMS exhibe transparencia de distribucin, el usuario no necesita saber: Que los datos estn en particiones. Que los datos pueden ser replicados en varios sitios. La ubicacin de los datos.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 186

Transparencia
Transparencia de transaccin, la cual permite que una transaccin actualice datos en varios sitios. La transparencia de transaccin garantiza que la transaccin ser o completada en su totalidad o abortada, con lo cual se mantiene la integridad de la base de datos. Transparencia de falla, la cual permite que el sistema contine operando en el caso de una falla de nodo. Las funciones que se perdieron a causa de la falla sern recobradas por otro nodo de la red.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 187

Transparencia
Transparencia de desempeo, la cual permite que el sistema funcione como si fuera un DBMS centralizado. El sistema no sufrir ninguna degradacin de desempeo por su uso en una red o por diferencia de plataforma de la red. La transparencia de desempeo tambin garantiza que el sistema encontrar la ruta de acceso ms barata a los datos remotos. Transparencia de heterogeneidad, la cual permite la integracin de varios DBMS locales diferentes conforme a un esquema comn, global. El DDBMS es responsable de transformar solicitudes de datos del esquema global en el esquema de DBMS local.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 188

Transparencia
Transparencia de Distribucin Permite manejar una base de datos fsicamente dispersa como si fuera centralizada. El nivel de transparencia soportado vara de sistema a sistema, se pueden identificar tres niveles de transparencia. Transparencia de fragmentacin, es el mayor nivel de transparencia. El usuario o programador no necesita saber que una base de datos est en particiones. Por consiguiente, ni los nombres ni la ubicacin de los fragmentos se especifican antes de acceder a los datos. Transparencia de ubicacin, existe cuando el usuario o programador debe especificar los nombres de los fragmentos de la base de datos, pero no su ubicacin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 189

Transparencia
Transparencia de ubicacin local, existe cuando el usuario o programador debe especificar tanto los nombres como las ubicaciones de los fragmentos. Si la sentencia SQL requiere:
Nivel Local Ubicacin Nombre del Nombre de fragmento la ubicacin Si Si Si No El DDBMS soporta Mapeo Local Transparencia de ubicacin Transparencia de fragmentacin
Verano 2011

Nivel de transparencia de distribucin Bajo Medio

Fragmentacin

No

No
FCC BUAP

Alto
190

MC Beatriz Beltrn Martnez

Transparencia
Se tiene la tabla Empleado con los atributos: Emp_Name, Emp_DOB, Emp_Salary, Emp_Address y Emp_Department.
DDBMS

Tabla Empleado

E1 New York

E2 Atlanta

E3 Miami

Fragmento Ubicacin

Se necesita a los empleados que nacieron antes del 1/Enero/1970


MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 191

Transparencia
CASO 1: La base de datos soporta transparencia de fragmentacin. SELECT * FROM EMPLEADO WHERE EMP_DOB < '01-JAN-1970'; CASO 2: La base de datos soporta transparencia de ubicacin SELECT * FROM El WHERE EMP_DOB < '01-JAN-1970'; UNION SELECT * FROM E2 WHERE EMP_DOB < '01-JAN-1970'; UNION SELECT * FROM E3 WHERE EMP_DOB < '01-JAN-1970';

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

192

Transparencia
CASO 3: La base de datos soporta transparencia de ubicacin local SELECT * FROM El NODE NY WHERE EMP_DOB < '01-JAN-1970'; UNION SELECT * FROM E2 NODE ATL WHERE EMP_DOB < '0l-JAN-1970'; UNION SELECT * FROM E3 NODE MIA WHERE EMP_DOB < '01-JAN-1970'; La transparencia de distribucin es soportada por un Diccionario de Datos Distribuidos (DDD) o Catlogo de Datos Distribuidos (DDC). El DDC contiene la descripcin de toda la base de datos tal como la ve su administrador.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 193

Transparencia
Transparencia de Transaccin Es una propiedad del DDBMS que garantiza que las transacciones de base de datos mantendrn la integridad y consistencia de la DDB. La transparencia de transaccin garantiza que la transaccin ser completada slo si todos los sitios implicados completan su parte. Se trate o no de una transaccin distribuida, est formada por una o ms solicitudes a la base de datos. La diferencia entre una transaccin no distribuida y una distribuida, es que la segunda puede actualizar y solicitar datos de varios sitios remotos en una red.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 194

Transparencia
Se realiza mediante BEGIN WORK y COMMIT WORK. Una solicitud remota permite accesar datos que sern procesados por un solo procesador de la BD remota, en otras palabras, la sentencia SQL (o solicitud) puede hacer referencia a datos en un slo sitio remoto.

BEGIN WORK; UPDATE CLIENTE SET CUS_BALANCE = CUS_BALANCE + 120 WHERE CUS_NUM = 'l00'; INSERT INTO FACTURA (CUS_NUM, INV_DATE, INV_TOTAL) VALUES '100', '15-FEB-2002', 120.00; COMMIT WORK;
FCC BUAP Verano 2011 195

MC Beatriz Beltrn Martnez

Transparencia
Una transaccin distribuida permite que una transaccin haga referencia a varios sitios de procesamiento de datos diferentes. Aunque cada solicitud puede hacer referencia slo a un sitio de procesamiento de datos remoto, la transaccin como un todo puede hacer referencia a varios sitios de procesamiento de datos.
BEGIN WORK; SELECT * FROM PRODUCTO WHERE PROD_NUM = '231785'; UPDATE CLIENTE SET CUS_BALANCE = CUS_BALANCE + 120 WHERE CUS_NUM = '100'; INSERT INTO FACTURA (CUS_NUM, INV_DATE, INV_TOTAL) VALUES ('100', '15-FEB-2002', 120.00); COMMIT WORK;
FCC BUAP Verano 2011

MC Beatriz Beltrn Martnez

196

Transparencia
La transparencia de transaccin garantiza que las transacciones distribuidas sean tratadas como transacciones centralizadas garantizando seriabilidad. Esto es, la ejecucin de transacciones concurrentes distribuidas o no llevar a la BD de un estado consistente a otro, Control de concurrencia distribuido: Es importante debido a que hay ms posibilidad que las operaciones en sitios mltiples y procesos mltiples creen inconsistencia en datos y transacciones detenidas.

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

197

Transparencia
Protocolo COMMIT de dos fases: Una DDB hace posible que una transaccin accese datos en varios sitios, entonces, debe emitirse un COMMIT final hasta que todos los sitios hayan completado sus partes de la transaccin. El protocolo COMMIT de dos fases garantiza que, si una parte de la operacin de transaccin no puede completarse, todos los cambios realizados en los otros sitios que participan en la transaccin sern deshechos para mantener un estado de base datos consistente. Cada procesador de datos mantiene su propio registro de transaccin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 198

Transparencia
El protocolo DO-UNDO-REDO define tres tipos de operaciones:
1. DO realiza la operacin y registra los valores "antes" y "despus" en el registro de transacciones. 2. UNDO revoca una operacin, mediante los ingresos registrados escritos por la parte DO de la secuencia. 3. REDO rehace una operacin, mediante los ingresos registrados por la parte DO de la secuencia.
FCC BUAP Verano 2011 199

MC Beatriz Beltrn Martnez

Transparencia
FASE 1: PREPARACIN
1. El coordinador enva un mensaje PREPARED TO COMMIT a todos los subordinados. 2. Los subordinados reciben el mensaje, escriben el registro de transacciones mediante el protocolo de escritura anticipada y envan un mensaje de confirmacin YES/PREPARED TO COMMIT (preparado para completar) o NO/NOT PREPARED, al coordinador. 3. El coordinador se asegura de que todos los nodos estn listos para completar o abortar la accin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 200

Transparencia
Si todos los nodos estn preparados para completar, la transaccin pasa a la Fase 2. Si uno o ms nodos responden NO o NOT PREPARED, el coordinador enva un mensaje ABORT a todos los subordinados.

FASE 2: EL COMMIT FINAL

1. El coordinador enva un mensaje COMMIT a todos los subordinados y espera las respuestas. 2. Cada subordinado recibe un mensaje COMMIT, luego actualiza la base de datos mediante el protocolo DO. 3. Los subordinados contestan con un mensaje COMMITTED o NOT COMMITTED al coordinador.

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

201

Transparencia
Transparencia de Desempeo y Optimizacin de Consultas La disponibilidad de datos es una funcin importante en las BD, en un DDBMS al tener en fragmentos la BD dificulta las consultas ya que el DDBMS debe decidir qu fragmento acceder; adems, de que los datos pueden estar replicados en varios sitios diferentes complicando an ms el acceso. El DDBMS utiliza tcnicas de optimizacin de consultas. El objetivo de una rutina de optimizacin de consulta es reducir al mnimo el costo total asociado con la ejecucin de una solicitud.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 202

Transparencia
Los costos asociados con una solicitud son una funcin:
Del costo del tiempo de acceso (E/S) implicado al accesar los datos fsicos guardados en disco. Del costo de comunicacin asociado con la transmisin de datos entre nodos en sistemas de base de datos distribuidos. Del costo de tiempo de CPU asociado con la sobrecarga de procesamiento de manejar transacciones distribuidas.
FCC BUAP Verano 2011 203

MC Beatriz Beltrn Martnez

Transparencia
Se debe proporcionar transparencia de distribucin as como transparencia de rplica, las cuales son importantes. La transparencia de rplica se refiere a la capacidad del DDBMS de ocultar la existencia de copias mltiples de datos al usuario. La mayora de los algoritmos para la optimizacin de consultas se basan en dos principios:
La seleccin del orden de ejecucin ptimo. La seleccin de los sitios a ser accesados para reducir al mnimo los costos de comunicacin.

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

204

Transparencia
Los modos de operacin se clasifican en:

Los algoritmos de optimizacin de consultas tambin se clasifican de acuerdo con el momento en el que se realiza la optimizacin y se tienen:

Optimizacin de consulta automtica, el DDBMS localiza la ruta de acceso ms barata sin la intervencin del usuario. Optimizacin de consulta manual, requiere que la optimizacin sea seleccionada y programada por el usuario o programador.

Optimizacin de consulta esttica, ocurre en tiempo de compilacin, ocurre cuando la consulta es compilada por el DBMS o se crea un plan para accesar la base de datos. Optimizacin de consulta dinmica, ocurre en tiempo de ejecucin, la estrategia de acceso a la base de datos se define cuando se ejecuta el programa.

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

205

Diseo
El diseo tiene los mismos puntos de una BD centralizada; no obstante, el diseo de una base de datos distribuida introduce tres temas nuevos: Cmo dividir la base de datos en fragmentos. Qu fragmentos replicar. Dnde localizar esos fragmentos y rplicas.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 206

Fragmentacin
Permite dividir en dos o ms segmentos o fragmentos BD y tablas. Cada fragmento puede guardarse en un sitio distinto dentro de la red. La informacin de la fragmentacin de los datos se guarda en un catlogo de datos distribuidos (DDC), que se accesa por el procesador de transacciones. Se tienen tres estrategias de fragmentacin:
Fragmentacin horizontal, se refiere a la divisin de una relacin en subconjunto (fragmentos) de tuplas, cada fragmento se guarda en un nodo diferente, y cada uno de ellos tiene filas nicas. Pero todas tienen los mismos atributos.
FCC BUAP Verano 2011 207

MC Beatriz Beltrn Martnez

Fragmentacin
Fragmentacin vertical, se refiere a la divisin de una relacin en subconjuntos de atributo (columna) cada conjunto (fragmento) se guarda en un nodo diferente, y cada fragmento tiene columnas nicas, con la excepcin de la columna clave, la cual es comn a todos los fragmentos. Fragmentacin mezclada, se refiere a una combinacin de estrategias horizontales y verticales, donde se tienen subconjuntos horizontales (filas), y a su vez tienen subconjuntos de los atributos (columnas).

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

208

Fragmentacin
Cus_Num 10 Cus_Nom Lpez Dir 14 ote Estado Pue Limite 350000 Balance 27000 Adeudo 12450

11
12 13 14 15

Gmez
Aranda Mndez Merino Reyes

Perisur
11 norte Revolucin Zaragoza Sur 10

DF
Pue DF DF Ver
FCC BUAP

600000
400000 600000 120000 200000
Verano 2011

12000
35000 58900 5500 3500

0
34000 10900 0 500
209

MC Beatriz Beltrn Martnez

Fragmentacin
Fragmentacin Horizontal

Nom_fragm

Ubicacin

Condicin

Nom_Nodo

Num_Cus

Num_Reg

CUST_H1
CUST_H2 CUST_H3

Puebla
DF Veracruz

Estado = Pue
Estado = DF Estado = Ver

PUE
DF VER

10, 12
11, 13, 14 15

2
3 1

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

210

Fragmentacin
Nombre del Fragmento = CUST_H1
Cus_Num 10 12 Cus_Nom Lpez Aranda Dir 14 ote 11 norte Estado Pue Pue Limite 350000 400000 Balance 27000 35000 Adeudo 12450 34000

Nombre del Fragmento = CUST_H2


Cus_Num Cus_Nom Dir Estado Limite Balance Adeudo

11
13 14

Gmez
Mndez Merino

Perisur
Revolucin Zaragoza

DF
DF DF

600000
600000 120000

12000
58900 5500

0
10900 0

Nombre del Fragmento = CUST_H3


Cus_Num 15 Cus_Nom Reyes Dir Sur 10 Estado Ver
FCC BUAP

Limite 200000
Verano 2011

Balance 3500

Adeudo 500
211

MC Beatriz Beltrn Martnez

Fragmentacin
Fragmentacin Vertical
Nom_fragm CUST_V1 CUST_V2 Ubicacin Servicios Coleccin Nom_Nodo SVC COL Nom_Atributo Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

212

Fragmentacin
Cus_Num Cus_Nom Lpez Gmez Aranda Mndez Merino Reyes Dir 14 ote Perisur 11 norte Revolucin Zaragoza Sur 10 Estado Pue DF Pue DF DF Ver

Nombre del Fragmento = CUST_V1

10 11 12 13 14

Cus_Num 10 11 12 13 14 15

Limite 350000 600000 400000 600000 120000 200000

Balance 27000 12000 35000 58900 5500 3500

Adeudo 12450 0 34000 10900 0 500


FCC BUAP

15

Nombre del Fragmento = CUST_V2

MC Beatriz Beltrn Martnez

Verano 2011

213

Fragmentacin
Fragmentacin Mezcladas
Nom_fragm CUST_M1 CUST_M2 CUST_M3 CUST_M4 Ubicacin PueServ PueCol DFServ DFCol Criterio_Hor Nom_Nodo Num_Cus Estado = Pue Estado = Pue Estado = DF Estado = DF PUE-S PUE-C DF-S DF-C 10, 12 10, 12 11, 13, 14 11, 13, 14 Criterio_Ver
Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo

CUST_M5
CUST_M6

VerServ
VerCol

Estado = Ver
Estado = Ver

VER-S
VER-C

15
15
Verano 2011

MC Beatriz Beltrn Martnez

FCC BUAP

214

Fragmentacin
Cus_Num Cus_Nom Lpez Aranda Cus_Nom Gmez Mndez Merino Dir 14 ote 11 norte Dir Perisur Revolucin Zaragoza Estado Pue Pue Estado DF DF DF

Nombre del Fragmento = CUST_M1

10 12 Cus_Num

Nombre del Fragmento = CUST_M3

11 13 14

Cus_Num

Cus_Nom Reyes

Dir Sur 10

Estado Ver

Nombre del Fragmento = CUST_M5

15

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

215

Fragmentacin
Cus_Num Limite 350000 400000 Limite Balance 27000 35000 Balance Adeudo 12450 34000 Adeudo

Nombre del Fragmento = CUST_M2

10 12 Cus_Num

Nombre del Fragmento = CUST_M4

11
13

600000
600000

12000
58900

0
10900

14 Cus_Num
15

120000 Limite
200000

5500 Balance
3500

0 Adeudo
500

Nombre del Fragmento = CUST_M6

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

216

Replicacin
Se refiere al almacenamiento de copias de datos en sitios mltiples, puede ser para satisfacer requerimientos de informacin, adems de mejorar la disponibilidad de los datos y el tiempo respuesta; finalmente estas copias reducen los costos de comunicacin y de consulta totales. Los datos replicados se someten a la regla de consistencia mutua, la cual requiere que todas las copias de fragmentos de datos sean idnticas, esto quiere decir que cuando hay una actualizacin de la base de datos se realiza en todos los sitios donde hay rplicas. Aunque se tiene beneficios, tambin exige ms complejidad de procesamiento del DDBMS cada copia de datos debe ser mantenida por el sistema.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 217

Replicacin
De esta forma, una operacin READ (lectura) selecciona la copia ms cercana para satisfacer la transaccin. Una operacin WRITE (escritura) requiere que todas las copias se seleccionen y actualicen.
1. El procesador de transacciones enva una solicitud de datos a cada procesador de datos para su ejecucin. 2. El procesador de datos recibe y ejecuta cada solicitud y enva los datos de vuelta al procesador de transacciones 3. El procesador de transacciones arma las respuestas del procesador de datos.

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

218

Replicacin
Existen tres escenarios de replicacin:
Base de datos totalmente replicada, guarda varias copias de cada fragmento de la base de datos en varios sitios. No es prctica debido la cantidad de carga impuesta al sistema. Base de datos parcialmente replicada, guarda mltiples copias de algunos fragmentos de la base de datos en mltiples sitios. Se tiene un buen manejo Base de datos no replicada, guarda cada fragmento de base de datos en un solo sitio.
FCC BUAP Verano 2011 219

MC Beatriz Beltrn Martnez

Colocacin
Describe el proceso de decidir dnde localizar los datos. Las estrategias que se tienen:

Colocacin centralizada de los datos, toda la base de datos se guarda en un sitio. Colocacin particionada de los datos, la base de datos se divide en varias partes desarticuladas (fragmentos) y se guardan en varios sitios. Colocacin replicada de los datos, se guardan copias de uno o ms fragmentos de la base de datos en varios sitios.
FCC BUAP Verano 2011 220

MC Beatriz Beltrn Martnez

Colocacin
La distribucin de los datos se logra mediante la particin de los datos, replicacin de los datos o mediante una combinacin de ambas. La colocacin de los datos est estrechamente relacionada en como la BD se divide o fragmenta. La colocacin de los datos ve qu datos localizar y en dnde. Los algoritmos de colocacin de los datos consideran varios factores, incluidos:

Objetivos de desempeo y disponibilidad de los datos. Tamao, nmero de filas y el nmero de relaciones que una entidad mantiene con otras entidades. Tipos de transacciones a ser aplicadas a la base de datos. Los atributos accesados por cada una de las transacciones.

MC Beatriz Beltrn Martnez

FCC BUAP

Verano 2011

221

You might also like