You are on page 1of 13

TALLER BASE DE DATOS

TALLER DE BASES DE DATOS II







INTEGRANTES:
CAROLINA GRACIA
CARLOS ANDRES PEREZ
MARYURY FORERO








UNIVERSIDAD DE CUNDINAMARCA
INGENIERIA DE SISTEMAS
FUSAGASUGA

TALLER BASE DE DATOS





1. Diferencia entre BDD, SBDD Y SMBDD
2. Explique cmo funciona un sistema de bases de datos Distribuida (SBDD).
Realice un ejemplo.
3. Arquitectura de una base de datos.
4. Cules son las ventajas de los sistemas distribuidos?, Cules son las
desventajas?
5. Realice un cuadro comparativo con las diferencias y semejanzas entre una
base de datos centralizada y una base de datos distribuidas.
6. En que ambientes, se cuenta con un sistema de Bases de Datos
distribuidos?
7. Mencione y explique con sus propias palabras las 12 reglas u objetivos de
una base de datos distribuida.
8. Realice un ejemplo con la base de datos proyectos para: fragmentacin
Vertical, fragmentacin horizontal y fragmentacin mixta.



















TALLER BASE DE DATOS








SOLUCION
1. Una base de datos distribuida (BDD) es un conjunto de mltiples bases de
datos lgicamente relacionadas las cuales se encuentran distribuidas entre
diferentes sitios interconectados por una red de comunicaciones
Un sistema de bases de datos distribuida (SBDD) es un sistema en el cual
mltiples sitios de bases de datos estn ligados por un sistema de
comunicaciones, de tal forma que, un usuario en cualquier sitio puede accesar los
datos en cualquier parte de la red exactamente como si los datos estuvieran
almacenados en su sitio propio.
Un sistema de manejo de bases de datos distribuidas (SMBDD) es aquel que
se encarga del manejo de la BDD y proporciona un mecanismo de acceso que
hace que la distribucin sea transparente a los usuarios. El trmino transparente
significa que la aplicacin trabajara, desde un punto de vista lgico, como si un
solo SMBD ejecutado en una sola mquina, administrara esos datos.
Un sistema de base de datos distribuida (SBDD) es entonces el resultado de la
integracin de una base de datos distribuida con un sistema para su manejo.

2. UN SISTEMA DE BASES DE DATOS DISTRIBUIDA (SBDD) es un sistema en
el cual mltiples sitios de bases de datos estn ligados por un sistema de
comunicaciones, de tal forma que, un usuario en cualquier sitio puede accesar los
datos en cualquier parte de la red exactamente como si los datos estuvieran
almacenados en su sitio propio.
un sistema de tiempo compartido no incluye necesariamente un sistema de
manejo de bases de datos y, en caso de que lo haga, ste es controlado y
administrado por una sola computadora.
TALLER BASE DE DATOS

Un sistema de multiprocesamiento puede administrar una base de datos pero lo
hace usualmente a travs de un solo sistema de manejo de base de datos; los
procesadores se utilizan para distribuir la carga de trabajo del sistema completo o
incluso del propio SMBD pero actuando sobre una sola base de datos. Finalmente,
una base de datos la cual reside en un solo sitio de una red de computadoras y
que es accesada por todos los nodos de la red no es una base de datos distribuida

Este caso se trata de una base de datos cuyo control y administracin esta
centralizada en un solo nodo pero se permite el acceso a ella a travs de la red de
computadoras.

3. ARQUITECTURA DE LOS SISTEMAS DE BASES DE DATOS
Hay tres caractersticas importantes inherentes a los sistemas de bases de datos:
la separacin entre los programas de aplicacin y los datos, el manejo de mltiples
vistas por parte de los usuarios y el uso de un catlogo para almacenar el
esquema de la base de datos. En 1975, el comit ANSI-SPARC (American
National Standard Institute - Standards Planning and Requirements Committee)
propuso una arquitectura de tres niveles para los sistemas de bases de datos, que
resulta muy til a la hora de conseguir estas tres caractersticas.
TALLER BASE DE DATOS

El objetivo de la arquitectura de tres niveles es el de separar los programas de
aplicacin de la base de datos fsica. En esta arquitectura, el esquema de una
base de datos se define en tres niveles de abstraccin distintos:
1. En el nivel interno se describe la estructura fsica de la base de datos
mediante un esquema interno. Este esquema se especifica mediante un
modelo fsico y describe todos los detalles para el almacenamiento de la
base de datos, as como los mtodos de acceso.
2. En el nivel conceptual se describe la estructura de toda la base de datos
para una comunidad de usuarios (todos los de una empresa u
organizacin), mediante un esquema conceptual. Este esquema oculta los
detalles de las estructuras de almacenamiento y se concentra en describir
entidades, atributos, relaciones, operaciones de los usuarios y restricciones.
En este nivel se puede utilizar un modelo conceptual o un modelo lgico
para especificar el esquema.
3. En el nivel externo se describen varios esquemas externos o vistas de
usuario. Cada esquema externo describe la parte de la base de datos que
interesa a un grupo de usuarios determinado y oculta a ese grupo el resto
de la base de datos. En este nivel se puede utilizar un modelo conceptual o
un modelo lgico para especificar los esquemas.
La mayora de los SGBD no distinguen del todo los tres niveles. Algunos incluyen
detalles del nivel fsico en el esquema conceptual. En casi todos los SGBD que se
manejan vistas de usuario, los esquemas externos se especifican con el mismo
modelo de datos que describe la informacin a nivel conceptual, aunque en
algunos se pueden utilizar diferentes modelos de datos en los niveles conceptual y
externo.
Hay que destacar que los tres esquemas no son ms que descripciones de los
mismos datos pero con distintos niveles de abstraccin. Los nicos datos que
existen realmente estn a nivel fsico, almacenados en un dispositivo como puede
ser un disco. En un SGBD basado en la arquitectura de tres niveles, cada grupo
de usuarios hace referencia exclusivamente a su propio esquema externo. Por lo
tanto, el SGBD debe transformar cualquier peticin expresada en trminos de un
esquema externo a una peticin expresada en trminos del esquema conceptual,
y luego, a una peticin en el esquema interno, que se procesar sobre la base de
datos almacenada. Si la peticin es de una obtencin (consulta) de datos, ser
preciso modificar el formato de la informacin extrada de la base de datos
almacenada, para que coincida con la vista externa del usuario. El proceso de
transformar peticiones y resultados de un nivel a otro se
TALLER BASE DE DATOS

denomina correspondencia o transformacin. Estas correspondencias pueden
requerir bastante tiempo, por lo que algunos SGBD no cuentan con vistas
externas.
La arquitectura de tres niveles es til para explicar el concepto de independencia
de datos que podemos definir como la capacidad para modificar el esquema en un
nivel del sistema sin tener que modificar el esquema del nivel inmediato superior.
Se pueden definir dos tipos de independencia de datos:
La independencia lgica es la capacidad de modificar el esquema
conceptual sin tener que alterar los esquemas externos ni los programas de
aplicacin. Se puede modificar el esquema conceptual para ampliar la base
de datos o para reducirla. Si, por ejemplo, se reduce la base de datos
eliminando una entidad, los esquemas externos que no se refieran a ella no
debern verse afectados.
La independencia fsica es la capacidad de modificar el esquema interno sin
tener que alterar el esquema conceptual (o los externos). Por ejemplo,
puede ser necesario reorganizar ciertos ficheros fsicos con el fin de
mejorar el rendimiento de las operaciones de consulta o de actualizacin de
datos. Dado que la independencia fsica se refiere slo a la separacin
entre las aplicaciones y las estructuras fsicas de almacenamiento, es ms
fcil de conseguir que la independencia lgica.
En los SGBD que tienen la arquitectura de varios niveles es necesario ampliar el
catlogo o diccionario, de modo que incluya informacin sobre cmo establecer la
correspondencia entre las peticiones de los usuarios y los datos, entre los diversos
niveles. El SGBD utiliza una serie de procedimientos adicionales para realizar
estas correspondencias haciendo referencia a la informacin de correspondencia
que se encuentra en el catlogo. La independencia de datos se consigue porque
al modificarse el esquema en algn nivel, el esquema del nivel inmediato superior
permanece sin cambios, slo se modifica la correspondencia entre los dos niveles.
No es preciso modificar los programas de aplicacin que hacen referencia al
esquema del nivel superior.
Por lo tanto, la arquitectura de tres niveles puede facilitar la obtencin de la
verdadera independencia de datos, tanto fsica como lgica. Sin embargo, los dos
niveles de correspondencia implican un gasto extra durante la ejecucin de una
consulta o de un programa, lo cual reduce la eficiencia del SGBD. Es por esto que
muy pocos SGBD han implementado esta arquitectura completa.
TALLER BASE DE DATOS

4.

Ventajas:
Procesadores ms poderosos y a menos costos
Desarrollo de Estaciones con ms capacidades
Las estaciones satisfacen las necesidades de los usuarios.
Uso de nuevas interfaces.
Avances en la Tecnologa de Comunicaciones.
Disponibilidad de elementos de Comunicacin.
Desarrollo de nuevas tcnicas.
Comparticin de Recursos.
Dispositivos (Hardware).
Programas (Software).
Eficiencia y Flexibilidad.
Respuesta Rpida.
Ejecucin Concurrente de procesos (En varias computadoras).
Empleo de tcnicas de procesamiento distribuido.
Disponibilidad y Confiabilidad.
Sistema poco propenso a fallas (Si un componente no afecta a la
disponibilidad del sistema).
Mayores servicios que elevan la funcionalidad ( Monitoreo, Telecontrol,
Correo Elctrico, Etc.).
Crecimiento Modular.
Es inherente al crecimiento.
Inclusin rpida de nuevos recursos.
Los recursos actuales no afectan.

Desventajas:

Requerimientos de mayores controles de procesamiento.
Velocidad de propagacin de informacin (Muy lenta a veces).
Servicios de replicacin de datos y servicios con posibilidades de fallas.
Mayores controles de acceso y proceso (Commit).
Administracin ms compleja.
Costos.

5.

TALLER BASE DE DATOS

B.D. DISTRIBUIDA B.D. CENTRALIZADA
DIFERENCIAS Todos los componentes
del sistema residen en un
solo computador o sitio.
Los componentes
consisten en los datos, el
software del Sistema de
Manejador de Bases de
Datos SMBD y los
dispositivos de
almacenamiento
secundario asociados,
como discos para el
almacenamiento en lnea
de la base de datos y
cintas para las copias de
seguridad.
Se pueden tener acceso
remoto a una base de
datos centralizada a
travs de terminales
conectadas al sitio; los
datos y el software del
SMBD residen
principalmente en un solo
sitio...
La base de datos est
almacenada en varias
computadoras
conectadas en red.
Surgen debido a la
existencia fsica de
organismos
descentralizados.
Esto les da la capacidad
de unir las bases de
datos de cada localidad y
acceder as a distintas
universidades, sucursales
Un solo punto de control de
los clientes para la Web y
lnea de comandos.
La vista del explorador
permite la administracin de
trabajos, calendarios, etc.
Los flujos de trabajos se
pueden editar y controlar en el
diseo grfico.
Los objetos son organizados
en una jerarqua de
archivo/directorio.
Grupo de comandos intuitivo.
Optimiza el procesamiento
automatizado que permite que
se lleve a cabo ms trabajo
sin intervencin.
Reduce el costo de personal
al permitir que los empleados
se enfoquen en tareas que
consuman menos tiempo y
sean menos repetitivas.
Inicia trabajos basados en
tiempo o eventos reduciendo
posibles errores humanos.
Reduce los costos de
operacin al eliminar la
programacin manual de
procesos repetitivos y
trabajosos.
Centraliza la gestin de tareas
programadas por toda la
empresa.
Realiza tareas rutinarias de
mantenimiento del sistema y
de procesamiento de datos
fuera de horas.
TALLER BASE DE DATOS

de tiendas, etcetera.

En un sistema distribuido,
las computadoras de
proceso, residen muchas
veces en las reas de
trabajo de los usuarios
En un sistema
centralizado/distribuido
existe un administrador
que controla la base de
datos
El procesamiento de Bases de
Datos Centralizadas es fcil
de controlar
En un sistema
centralizado/distribuido existe
un administrador que controla
la base de datos



6. . En que ambientes, se cuenta con un sistema de Bases de Datos distribuidos
Un ambiente computacional se dice distribuido cuando sus programas o BDs
estn ubicados en dos o ms computadores.
7. 1.Autonoma local. Los sitios en un sistema distribuido deben ser autnomos.
La autonoma local significa que todas las operaciones en un sitio
dado estn controladas por ese sitio; ningn sitio X debe depender
de algn otro sitio Y para su operacin satisfactoria.
La seguridad, integridad y representacin de almacenamiento de los
datos locales permanecen bajo el control y jurisdiccin del sitio local.
2. No dependencia de un sitio central. La autonoma local implica que todos los
sitios deben ser tratados como iguales.
Por lo tanto, no debe haber particularmente ninguna dependencia de
un sitio maestro central para algn servicio central, tal que todo el
sistema dependa de ese sitio central.
Razones por las cuales no debera haber un sitio central:
El sitio central puede ser un cuello de botella
TALLER BASE DE DATOS

El sistema sera vulnerable; es decir, si el sitio central falla,
tambin fallar todo el sistema
3. Operacin continua. Una ventaja de los sistemas distribuidos es que deben
proporcionar mayor confiabilidad y mayor disponibilidad.
Confiabilidad. La probabilidad de que el sistema est listo y
funcionando en cualquier momento dado. Los SD no son una
propuesta de todo o nada; pueden continuar operando cuando hay
alguna falla en algn componente independiente.
Disponibilidad. La probabilidad de que el sistema est listo y
funcionando continuamente a lo largo de un perodo especificado.
4. Independencia de ubicacin. Conocida tambin como transparencia de
ubicacin.
Los usuarios no tienen que saber dnde estn almacenados
fsicamente los datos, sino que deben ser capaces de comportarse
como si todos los datos estuvieran almacenados en su propio sitio
local.
Esto simplifica los programas de los usuarios. En particular, permite
que los datos emigren de un sitio a otro sin invalidar ninguno de
estos programas o actividades.
5. Independencia de fragmentacin. Un sistema soporta la fragmentacin de
datos cuando puede ser dividida en o partes o fragmentos, para efectos de
almacenamiento fsico.
La fragmentacin es necesaria por razones de rendimiento: los datos
pueden estar almacenados en la ubicacin donde son usados ms
frecuentemente para que la mayora de las operaciones sean locales
y se reduzca el trfico en la red.
Los usuarios deben comportarse como si los datos en realidad
estuvieran sin fragmentacin alguna.
6. Independencia de replicacin. El sistema soporta replicacin de datos cuando
un fragmento puede ser representado por muchas copias distintas, o rplicas,
guardadas en muchos sitios distintos.
Las rplicas son necesarias por dos razones principales:
TALLER BASE DE DATOS

1. Significan un mejor rendimiento (las aplicaciones pueden operar
sobre las copias locales en lugar de tener que comunicarse con sitios
remotos)
Independencia de replicacin
2. Pueden significar una mejor disponibilidad (un objeto replicado
permanece disponible para su procesamiento, mientras est
disponible al menos una copia).
Por supuesto, la principal desventaja de las rplicas es que al
actualizarlas es necesario actualizar todas: el problema de la
propagacin de la actualizacin.

7. Procesamiento de consultas distribuidas. La optimizacin es importante en
un sistema distribuido que en uno centralizado, incluso mucho ms.
El punto bsico es que en una consulta que involucra a varios sitios,
habr muchas formas posibles de mover los datos en el sistema para
satisfacer la solicitud, y es crucialmente importante que se encuentre
una estrategia eficiente.
8. Administracin de transacciones distribuidas. Existen dos aspectos
principales en la administracin de transacciones: control de recuperacin y
control de la concurrencia.
Ambos aspectos requieren un tratamiento amplio en el ambiente
distribuido.
Ya que una sola transaccin puede involucrar la ejecucin de cdigo
en muchos sitios.
Administracin de transacciones distribuidas
Puede involucrar actualizaciones en muchos sitios y se debe de
cuidar que la transaccin no caiga en un bloqueo mortal (basado en
el bloqueo).
Para el control de la recuperacin, es necesario asegurarse que una
transaccin dada sea atmica en el ambiente distribuido, el sistema
TALLER BASE DE DATOS

debe por lo tanto asegurarse de que la transaccin sea confirmada o
deshecha (se puede utilizar el protocolo de confirmacin de dos
fases).

9. Independencia de hardware. Soporte para un gran nmero de mquinas
diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al
usuario una imagen del sistema nico.
10. Independencia de sistema operativo. Obviamente es necesario no slo
tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de
hardware, sino tambin ejecutarlo en diferentes plataformas de sistema operativo.

11. Independencia de red.
Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es
obviamente necesario tener la posibilidad de soportar tambin una variedad de
redes de comunicacin distintas.
12. Independencia de DBMS. Lo que se necesita es que todos los ejemplares de
DBMS en sitios diferentes soporten la misma interfaz.
Aunque no tienen que ser necesariamente copias del mismo
software DBMS.
En otras palabras, sera posible que el sistema distribuido fuera
heterogneo, al menos en cierto grado.
Sera muy bueno si diferentes DBMS pudieran participar de alguna
forma en un sistema distribuido.

8.

FRAGMENTACION VERTICAL (subdivisin de atributos en grupos)
r1
EMPLEADOS:(apellidos, nombre, direccion, telefono, funcion, localizacin,
extension)
r2
TALLER BASE DE DATOS

r1 = P apellidos, nombre, direccion, telefono, funcion (EMPLEADOS)
r2 = P apellidos, nombre, localizacion, extension (EMPLEADOS)
EMPLEADOS = r1 >< r2




FRAGMENTACION HORIZONTAL

PRODUCTOS (cod_prod, nombre, descripcion, almacen)

ALMACEN (cod_almacen, direccion, telefono, area)

Informacin de los almacenes ubicados en cada una de las reas.
ALMACEN
i
= s
area = i
(ALMACEN) donde i = {norte, sur, este, oeste}

You might also like