Professional Documents
Culture Documents
Introduccin
El desarrollo y uso de sistemas de bases de datos distribuidas son promovidos principalmente por la creciente dispersin de las operaciones de negocios y el avance tecnolgico (redes). Aunque la dispersin de la BD en un sistema de BDD requiere de un DBMS ms complejo el usuario final no debe preocuparse por al complejidad operativa.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 168
Introduccin
El sistema de administracin de bases de datos distribuidas (DDBMS) la trata como una sola base de datos lgica. Los conceptos de diseo bsico siguen vlidos, pero la complejidad del manejo de los datos y distribucin no necesita ser conocida por el usuario final.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 169
Historia
Un DDBMS rige el almacenamiento y procesamiento de datos lgicamente relacionados a travs de un sistema de computadoras interconectadas, donde los datos y procesamiento esta distribuido. En los 70s las corporaciones ejercen sistemas de administracin de BD centralizados. Se usa un mainframe y el acceso se realiza por terminales no inteligentes.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 170
Historia
Se inician el modelo relacional, pero no tena resultados aceptables como el modelo jerrquico o el de red. En los 80s, se tienen cambios, entre los cuales se tiene:
Operaciones descentralizadas y acceso mltiple. Demanda de los clientes . Redes tipo LAN. Compartir datos resulta atractivo.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 171
Historia
La informacin se ve ms dinmica y las operaciones son necesariamente rpidas. En los 90s, estos factores se incrementaron y hay influencia de:
Incremento del WWW. Almacenes de datos. Mejor desempeo. Seguridad.
FCC BUAP Verano 2011 172
Ventajas
Los datos se localizan cerca del sitio de mayor demanda. Acceso ms rpido a los datos. Procesamiento ms rpido de los datos. Facilitacin de crecimiento. Comunicacin mejorada. Costos de operacin reducidos. Interface de usuario fcil de usar. Menos peligro de falla en un sitio. Independencia de procesador.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 173
Desventajas
Complejidad del manejo y control. Seguridad. Falta de estndares, protocolos de comunicacin a nivel de base de datos. Requerimientos de almacenamiento incrementados (menor problema). Mayor dificultad en el manejo del ambiente de datos. Altos costos de entrenamiento.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 174
Definicin
El procesamiento distribuido, comparte el procesamiento lgico de la BD entre dos o ms sitios fsicamente independientes conectados mediante una red. Una base de datos distribuida guarda una BD lgicamente relacionada en dos o ms sitios fsicamente independientes. La BD se compone de varias partes conocidas como fragmentos de la Base de Datos.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 175
Definicin
Procesamiento distribuido:
Computadora A
DBMS Sitio 1
BD
Sitio 2
Red Sitio 3
FCC BUAP
Verano 2011
176
Definicin
Computadora A
BD Distribuida
DBMS
F1
Red
Computadora B Computadora C
DBMS
DBMS
F2
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011
F3
177
Componentes
Estaciones de sistema de red. trabajo que formen el
El DDBS debe ser independiente del hardware.
Componentes
El procesador de transacciones (TP) es un componente de software encontrado en cada computadora que solicita datos.
El procesador recibe y procesa las solicitudes de datos de la aplicacin. El TP tambin se le conoce como procesador de aplicaciones (AP) o administrador de transacciones (TM).
El procesador de datos (DP) es el componente de software residente en cada computadora que guarda y recupera datos localizados en el sitio.
El DP tambin se le llama administrador de datos (DM).
FCC BUAP Verano 2011 179
Componentes
Cada procesador de transacciones puede accesar datos en cualquier procesador de datos y cada procesador de datos maneja todas las solicitudes de datos locales de cualquier procesador de transacciones.
MC Beatriz Beltrn Martnez
TP
TP
TP DP
DP
Red
TP DP TP DP DP
FCC BUAP
Verano 2011
180
Componentes
Los protocolos DDBS: determinan como el
Se comunicar con la red para transportar datos y comandos entre los DP y TP. Sincronizar todos los datos recuperados de los DP y los encauzar a los TP apropiados. Garantizar funciones de BD comunes en un sistema distribuido, incluyendo seguridad, concurrencia, el control, respaldos y recuperacin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 181
Niveles
Niveles de Distribucin de los Datos y Procesos
Datos en un sitio Procesamiento en un sitio DBMS anfitrin Mainframe Datos en mltiples sitios
No aplicable
DDBMS Cliente / Servidor Totalmente distribuido
182
Verano 2011
Niveles
Procesamiento en un sitio y datos en un sitio (SPSD). Todo el procesamiento se realiza en un solo CPU o mainframe y todos los datos se guardan en el disco local de la computadora anfitriona. El procesamiento no puede ser realizado del lado del usuario del sistema. El DBMS est localizado en la computadora anfitriona, la cual es accesada por terminales no inteligentes conectadas a ella. Procesamiento en sitios mltiples, datos en un solo sitio (MPSD) Es en el que se realizan procesos mltiples en diferentes computadoras que comparten un solo depsito de datos.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 183
Niveles
En general, el escenario MPSD requiere un servidor de archivos de red que ejecuta aplicaciones convencionales que son accesadas mediante una LAN. Muchas aplicaciones de contabilidad para usuarios mltiples, que funcionan en una red de computadoras personales, encajan en esa opcin. Procesamiento en sitios mltiples, datos en sitios mltiples (MPMD) Describe un sistema de administracin de BD totalmente distribuida con soporte para mltiples procesadores de datos y de transacciones en diversos sitios.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 184
Niveles
Segn el soporte de diferentes tipos de DBMS centralizados, los DDBMS se clasifican como homogneos o heterogneos. Los DDBS homogneos integran slo un tipo de DBMS centralizado a travs de una red. Por lo tanto, el mismo DBMS se ejecutar en diferentes mainframes. Por el contrario los DDBS heterogneos integran diferentes tipos de DBMS centralizados a travs de una red. Un DDBMS totalmente heterogneo soportar diferentes DBMS que, incluso pueden soportar diferentes modelos de datos que funcionan en diferentes sistemas de cmputo.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 185
Transparencia
Las caractersticas de transparencia del DDBMS son caractersticas funcionales y tienen la propiedad comn de permitir que el usuario sienta que es el nico que est utilizando la base de datos. Las caractersticas de transparencia del DDBMS son: Transparencia de distribucin, la cual permite que una DDB sea tratada como una sola base de datos lgica. Si un DDBMS exhibe transparencia de distribucin, el usuario no necesita saber: Que los datos estn en particiones. Que los datos pueden ser replicados en varios sitios. La ubicacin de los datos.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 186
Transparencia
Transparencia de transaccin, la cual permite que una transaccin actualice datos en varios sitios. La transparencia de transaccin garantiza que la transaccin ser o completada en su totalidad o abortada, con lo cual se mantiene la integridad de la base de datos. Transparencia de falla, la cual permite que el sistema contine operando en el caso de una falla de nodo. Las funciones que se perdieron a causa de la falla sern recobradas por otro nodo de la red.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 187
Transparencia
Transparencia de desempeo, la cual permite que el sistema funcione como si fuera un DBMS centralizado. El sistema no sufrir ninguna degradacin de desempeo por su uso en una red o por diferencia de plataforma de la red. La transparencia de desempeo tambin garantiza que el sistema encontrar la ruta de acceso ms barata a los datos remotos. Transparencia de heterogeneidad, la cual permite la integracin de varios DBMS locales diferentes conforme a un esquema comn, global. El DDBMS es responsable de transformar solicitudes de datos del esquema global en el esquema de DBMS local.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 188
Transparencia
Transparencia de Distribucin Permite manejar una base de datos fsicamente dispersa como si fuera centralizada. El nivel de transparencia soportado vara de sistema a sistema, se pueden identificar tres niveles de transparencia. Transparencia de fragmentacin, es el mayor nivel de transparencia. El usuario o programador no necesita saber que una base de datos est en particiones. Por consiguiente, ni los nombres ni la ubicacin de los fragmentos se especifican antes de acceder a los datos. Transparencia de ubicacin, existe cuando el usuario o programador debe especificar los nombres de los fragmentos de la base de datos, pero no su ubicacin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 189
Transparencia
Transparencia de ubicacin local, existe cuando el usuario o programador debe especificar tanto los nombres como las ubicaciones de los fragmentos. Si la sentencia SQL requiere:
Nivel Local Ubicacin Nombre del Nombre de fragmento la ubicacin Si Si Si No El DDBMS soporta Mapeo Local Transparencia de ubicacin Transparencia de fragmentacin
Verano 2011
Fragmentacin
No
No
FCC BUAP
Alto
190
Transparencia
Se tiene la tabla Empleado con los atributos: Emp_Name, Emp_DOB, Emp_Salary, Emp_Address y Emp_Department.
DDBMS
Tabla Empleado
E1 New York
E2 Atlanta
E3 Miami
Fragmento Ubicacin
Transparencia
CASO 1: La base de datos soporta transparencia de fragmentacin. SELECT * FROM EMPLEADO WHERE EMP_DOB < '01-JAN-1970'; CASO 2: La base de datos soporta transparencia de ubicacin SELECT * FROM El WHERE EMP_DOB < '01-JAN-1970'; UNION SELECT * FROM E2 WHERE EMP_DOB < '01-JAN-1970'; UNION SELECT * FROM E3 WHERE EMP_DOB < '01-JAN-1970';
FCC BUAP
Verano 2011
192
Transparencia
CASO 3: La base de datos soporta transparencia de ubicacin local SELECT * FROM El NODE NY WHERE EMP_DOB < '01-JAN-1970'; UNION SELECT * FROM E2 NODE ATL WHERE EMP_DOB < '0l-JAN-1970'; UNION SELECT * FROM E3 NODE MIA WHERE EMP_DOB < '01-JAN-1970'; La transparencia de distribucin es soportada por un Diccionario de Datos Distribuidos (DDD) o Catlogo de Datos Distribuidos (DDC). El DDC contiene la descripcin de toda la base de datos tal como la ve su administrador.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 193
Transparencia
Transparencia de Transaccin Es una propiedad del DDBMS que garantiza que las transacciones de base de datos mantendrn la integridad y consistencia de la DDB. La transparencia de transaccin garantiza que la transaccin ser completada slo si todos los sitios implicados completan su parte. Se trate o no de una transaccin distribuida, est formada por una o ms solicitudes a la base de datos. La diferencia entre una transaccin no distribuida y una distribuida, es que la segunda puede actualizar y solicitar datos de varios sitios remotos en una red.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 194
Transparencia
Se realiza mediante BEGIN WORK y COMMIT WORK. Una solicitud remota permite accesar datos que sern procesados por un solo procesador de la BD remota, en otras palabras, la sentencia SQL (o solicitud) puede hacer referencia a datos en un slo sitio remoto.
BEGIN WORK; UPDATE CLIENTE SET CUS_BALANCE = CUS_BALANCE + 120 WHERE CUS_NUM = 'l00'; INSERT INTO FACTURA (CUS_NUM, INV_DATE, INV_TOTAL) VALUES '100', '15-FEB-2002', 120.00; COMMIT WORK;
FCC BUAP Verano 2011 195
Transparencia
Una transaccin distribuida permite que una transaccin haga referencia a varios sitios de procesamiento de datos diferentes. Aunque cada solicitud puede hacer referencia slo a un sitio de procesamiento de datos remoto, la transaccin como un todo puede hacer referencia a varios sitios de procesamiento de datos.
BEGIN WORK; SELECT * FROM PRODUCTO WHERE PROD_NUM = '231785'; UPDATE CLIENTE SET CUS_BALANCE = CUS_BALANCE + 120 WHERE CUS_NUM = '100'; INSERT INTO FACTURA (CUS_NUM, INV_DATE, INV_TOTAL) VALUES ('100', '15-FEB-2002', 120.00); COMMIT WORK;
FCC BUAP Verano 2011
196
Transparencia
La transparencia de transaccin garantiza que las transacciones distribuidas sean tratadas como transacciones centralizadas garantizando seriabilidad. Esto es, la ejecucin de transacciones concurrentes distribuidas o no llevar a la BD de un estado consistente a otro, Control de concurrencia distribuido: Es importante debido a que hay ms posibilidad que las operaciones en sitios mltiples y procesos mltiples creen inconsistencia en datos y transacciones detenidas.
FCC BUAP
Verano 2011
197
Transparencia
Protocolo COMMIT de dos fases: Una DDB hace posible que una transaccin accese datos en varios sitios, entonces, debe emitirse un COMMIT final hasta que todos los sitios hayan completado sus partes de la transaccin. El protocolo COMMIT de dos fases garantiza que, si una parte de la operacin de transaccin no puede completarse, todos los cambios realizados en los otros sitios que participan en la transaccin sern deshechos para mantener un estado de base datos consistente. Cada procesador de datos mantiene su propio registro de transaccin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 198
Transparencia
El protocolo DO-UNDO-REDO define tres tipos de operaciones:
1. DO realiza la operacin y registra los valores "antes" y "despus" en el registro de transacciones. 2. UNDO revoca una operacin, mediante los ingresos registrados escritos por la parte DO de la secuencia. 3. REDO rehace una operacin, mediante los ingresos registrados por la parte DO de la secuencia.
FCC BUAP Verano 2011 199
Transparencia
FASE 1: PREPARACIN
1. El coordinador enva un mensaje PREPARED TO COMMIT a todos los subordinados. 2. Los subordinados reciben el mensaje, escriben el registro de transacciones mediante el protocolo de escritura anticipada y envan un mensaje de confirmacin YES/PREPARED TO COMMIT (preparado para completar) o NO/NOT PREPARED, al coordinador. 3. El coordinador se asegura de que todos los nodos estn listos para completar o abortar la accin.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 200
Transparencia
Si todos los nodos estn preparados para completar, la transaccin pasa a la Fase 2. Si uno o ms nodos responden NO o NOT PREPARED, el coordinador enva un mensaje ABORT a todos los subordinados.
1. El coordinador enva un mensaje COMMIT a todos los subordinados y espera las respuestas. 2. Cada subordinado recibe un mensaje COMMIT, luego actualiza la base de datos mediante el protocolo DO. 3. Los subordinados contestan con un mensaje COMMITTED o NOT COMMITTED al coordinador.
FCC BUAP
Verano 2011
201
Transparencia
Transparencia de Desempeo y Optimizacin de Consultas La disponibilidad de datos es una funcin importante en las BD, en un DDBMS al tener en fragmentos la BD dificulta las consultas ya que el DDBMS debe decidir qu fragmento acceder; adems, de que los datos pueden estar replicados en varios sitios diferentes complicando an ms el acceso. El DDBMS utiliza tcnicas de optimizacin de consultas. El objetivo de una rutina de optimizacin de consulta es reducir al mnimo el costo total asociado con la ejecucin de una solicitud.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 202
Transparencia
Los costos asociados con una solicitud son una funcin:
Del costo del tiempo de acceso (E/S) implicado al accesar los datos fsicos guardados en disco. Del costo de comunicacin asociado con la transmisin de datos entre nodos en sistemas de base de datos distribuidos. Del costo de tiempo de CPU asociado con la sobrecarga de procesamiento de manejar transacciones distribuidas.
FCC BUAP Verano 2011 203
Transparencia
Se debe proporcionar transparencia de distribucin as como transparencia de rplica, las cuales son importantes. La transparencia de rplica se refiere a la capacidad del DDBMS de ocultar la existencia de copias mltiples de datos al usuario. La mayora de los algoritmos para la optimizacin de consultas se basan en dos principios:
La seleccin del orden de ejecucin ptimo. La seleccin de los sitios a ser accesados para reducir al mnimo los costos de comunicacin.
FCC BUAP
Verano 2011
204
Transparencia
Los modos de operacin se clasifican en:
Los algoritmos de optimizacin de consultas tambin se clasifican de acuerdo con el momento en el que se realiza la optimizacin y se tienen:
Optimizacin de consulta automtica, el DDBMS localiza la ruta de acceso ms barata sin la intervencin del usuario. Optimizacin de consulta manual, requiere que la optimizacin sea seleccionada y programada por el usuario o programador.
Optimizacin de consulta esttica, ocurre en tiempo de compilacin, ocurre cuando la consulta es compilada por el DBMS o se crea un plan para accesar la base de datos. Optimizacin de consulta dinmica, ocurre en tiempo de ejecucin, la estrategia de acceso a la base de datos se define cuando se ejecuta el programa.
FCC BUAP
Verano 2011
205
Diseo
El diseo tiene los mismos puntos de una BD centralizada; no obstante, el diseo de una base de datos distribuida introduce tres temas nuevos: Cmo dividir la base de datos en fragmentos. Qu fragmentos replicar. Dnde localizar esos fragmentos y rplicas.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 206
Fragmentacin
Permite dividir en dos o ms segmentos o fragmentos BD y tablas. Cada fragmento puede guardarse en un sitio distinto dentro de la red. La informacin de la fragmentacin de los datos se guarda en un catlogo de datos distribuidos (DDC), que se accesa por el procesador de transacciones. Se tienen tres estrategias de fragmentacin:
Fragmentacin horizontal, se refiere a la divisin de una relacin en subconjunto (fragmentos) de tuplas, cada fragmento se guarda en un nodo diferente, y cada uno de ellos tiene filas nicas. Pero todas tienen los mismos atributos.
FCC BUAP Verano 2011 207
Fragmentacin
Fragmentacin vertical, se refiere a la divisin de una relacin en subconjuntos de atributo (columna) cada conjunto (fragmento) se guarda en un nodo diferente, y cada fragmento tiene columnas nicas, con la excepcin de la columna clave, la cual es comn a todos los fragmentos. Fragmentacin mezclada, se refiere a una combinacin de estrategias horizontales y verticales, donde se tienen subconjuntos horizontales (filas), y a su vez tienen subconjuntos de los atributos (columnas).
FCC BUAP
Verano 2011
208
Fragmentacin
Cus_Num 10 Cus_Nom Lpez Dir 14 ote Estado Pue Limite 350000 Balance 27000 Adeudo 12450
11
12 13 14 15
Gmez
Aranda Mndez Merino Reyes
Perisur
11 norte Revolucin Zaragoza Sur 10
DF
Pue DF DF Ver
FCC BUAP
600000
400000 600000 120000 200000
Verano 2011
12000
35000 58900 5500 3500
0
34000 10900 0 500
209
Fragmentacin
Fragmentacin Horizontal
Nom_fragm
Ubicacin
Condicin
Nom_Nodo
Num_Cus
Num_Reg
CUST_H1
CUST_H2 CUST_H3
Puebla
DF Veracruz
Estado = Pue
Estado = DF Estado = Ver
PUE
DF VER
10, 12
11, 13, 14 15
2
3 1
FCC BUAP
Verano 2011
210
Fragmentacin
Nombre del Fragmento = CUST_H1
Cus_Num 10 12 Cus_Nom Lpez Aranda Dir 14 ote 11 norte Estado Pue Pue Limite 350000 400000 Balance 27000 35000 Adeudo 12450 34000
11
13 14
Gmez
Mndez Merino
Perisur
Revolucin Zaragoza
DF
DF DF
600000
600000 120000
12000
58900 5500
0
10900 0
Limite 200000
Verano 2011
Balance 3500
Adeudo 500
211
Fragmentacin
Fragmentacin Vertical
Nom_fragm CUST_V1 CUST_V2 Ubicacin Servicios Coleccin Nom_Nodo SVC COL Nom_Atributo Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo
FCC BUAP
Verano 2011
212
Fragmentacin
Cus_Num Cus_Nom Lpez Gmez Aranda Mndez Merino Reyes Dir 14 ote Perisur 11 norte Revolucin Zaragoza Sur 10 Estado Pue DF Pue DF DF Ver
10 11 12 13 14
Cus_Num 10 11 12 13 14 15
15
Verano 2011
213
Fragmentacin
Fragmentacin Mezcladas
Nom_fragm CUST_M1 CUST_M2 CUST_M3 CUST_M4 Ubicacin PueServ PueCol DFServ DFCol Criterio_Hor Nom_Nodo Num_Cus Estado = Pue Estado = Pue Estado = DF Estado = DF PUE-S PUE-C DF-S DF-C 10, 12 10, 12 11, 13, 14 11, 13, 14 Criterio_Ver
Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo Cus_Num, Cus_Nom, Dir, Estado Cus_Num, Lmite, Balance, Adeudo
CUST_M5
CUST_M6
VerServ
VerCol
Estado = Ver
Estado = Ver
VER-S
VER-C
15
15
Verano 2011
FCC BUAP
214
Fragmentacin
Cus_Num Cus_Nom Lpez Aranda Cus_Nom Gmez Mndez Merino Dir 14 ote 11 norte Dir Perisur Revolucin Zaragoza Estado Pue Pue Estado DF DF DF
10 12 Cus_Num
11 13 14
Cus_Num
Cus_Nom Reyes
Dir Sur 10
Estado Ver
15
FCC BUAP
Verano 2011
215
Fragmentacin
Cus_Num Limite 350000 400000 Limite Balance 27000 35000 Balance Adeudo 12450 34000 Adeudo
10 12 Cus_Num
11
13
600000
600000
12000
58900
0
10900
14 Cus_Num
15
120000 Limite
200000
5500 Balance
3500
0 Adeudo
500
FCC BUAP
Verano 2011
216
Replicacin
Se refiere al almacenamiento de copias de datos en sitios mltiples, puede ser para satisfacer requerimientos de informacin, adems de mejorar la disponibilidad de los datos y el tiempo respuesta; finalmente estas copias reducen los costos de comunicacin y de consulta totales. Los datos replicados se someten a la regla de consistencia mutua, la cual requiere que todas las copias de fragmentos de datos sean idnticas, esto quiere decir que cuando hay una actualizacin de la base de datos se realiza en todos los sitios donde hay rplicas. Aunque se tiene beneficios, tambin exige ms complejidad de procesamiento del DDBMS cada copia de datos debe ser mantenida por el sistema.
MC Beatriz Beltrn Martnez FCC BUAP Verano 2011 217
Replicacin
De esta forma, una operacin READ (lectura) selecciona la copia ms cercana para satisfacer la transaccin. Una operacin WRITE (escritura) requiere que todas las copias se seleccionen y actualicen.
1. El procesador de transacciones enva una solicitud de datos a cada procesador de datos para su ejecucin. 2. El procesador de datos recibe y ejecuta cada solicitud y enva los datos de vuelta al procesador de transacciones 3. El procesador de transacciones arma las respuestas del procesador de datos.
FCC BUAP
Verano 2011
218
Replicacin
Existen tres escenarios de replicacin:
Base de datos totalmente replicada, guarda varias copias de cada fragmento de la base de datos en varios sitios. No es prctica debido la cantidad de carga impuesta al sistema. Base de datos parcialmente replicada, guarda mltiples copias de algunos fragmentos de la base de datos en mltiples sitios. Se tiene un buen manejo Base de datos no replicada, guarda cada fragmento de base de datos en un solo sitio.
FCC BUAP Verano 2011 219
Colocacin
Describe el proceso de decidir dnde localizar los datos. Las estrategias que se tienen:
Colocacin centralizada de los datos, toda la base de datos se guarda en un sitio. Colocacin particionada de los datos, la base de datos se divide en varias partes desarticuladas (fragmentos) y se guardan en varios sitios. Colocacin replicada de los datos, se guardan copias de uno o ms fragmentos de la base de datos en varios sitios.
FCC BUAP Verano 2011 220
Colocacin
La distribucin de los datos se logra mediante la particin de los datos, replicacin de los datos o mediante una combinacin de ambas. La colocacin de los datos est estrechamente relacionada en como la BD se divide o fragmenta. La colocacin de los datos ve qu datos localizar y en dnde. Los algoritmos de colocacin de los datos consideran varios factores, incluidos:
Objetivos de desempeo y disponibilidad de los datos. Tamao, nmero de filas y el nmero de relaciones que una entidad mantiene con otras entidades. Tipos de transacciones a ser aplicadas a la base de datos. Los atributos accesados por cada una de las transacciones.
FCC BUAP
Verano 2011
221