INTEGRANTES: CAROLINA GRACIA CARLOS ANDRES PEREZ MARYURY FORERO
UNIVERSIDAD DE CUNDINAMARCA INGENIERIA DE SISTEMAS FUSAGASUGA
TALLER BASE DE DATOS
1. Diferencia entre BDD, SBDD Y SMBDD 2. Explique cmo funciona un sistema de bases de datos Distribuida (SBDD). Realice un ejemplo. 3. Arquitectura de una base de datos. 4. Cules son las ventajas de los sistemas distribuidos?, Cules son las desventajas? 5. Realice un cuadro comparativo con las diferencias y semejanzas entre una base de datos centralizada y una base de datos distribuidas. 6. En que ambientes, se cuenta con un sistema de Bases de Datos distribuidos? 7. Mencione y explique con sus propias palabras las 12 reglas u objetivos de una base de datos distribuida. 8. Realice un ejemplo con la base de datos proyectos para: fragmentacin Vertical, fragmentacin horizontal y fragmentacin mixta.
TALLER BASE DE DATOS
SOLUCION 1. Una base de datos distribuida (BDD) es un conjunto de mltiples bases de datos lgicamente relacionadas las cuales se encuentran distribuidas entre diferentes sitios interconectados por una red de comunicaciones Un sistema de bases de datos distribuida (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio puede accesar los datos en cualquier parte de la red exactamente como si los datos estuvieran almacenados en su sitio propio. Un sistema de manejo de bases de datos distribuidas (SMBDD) es aquel que se encarga del manejo de la BDD y proporciona un mecanismo de acceso que hace que la distribucin sea transparente a los usuarios. El trmino transparente significa que la aplicacin trabajara, desde un punto de vista lgico, como si un solo SMBD ejecutado en una sola mquina, administrara esos datos. Un sistema de base de datos distribuida (SBDD) es entonces el resultado de la integracin de una base de datos distribuida con un sistema para su manejo.
2. UN SISTEMA DE BASES DE DATOS DISTRIBUIDA (SBDD) es un sistema en el cual mltiples sitios de bases de datos estn ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio puede accesar los datos en cualquier parte de la red exactamente como si los datos estuvieran almacenados en su sitio propio. un sistema de tiempo compartido no incluye necesariamente un sistema de manejo de bases de datos y, en caso de que lo haga, ste es controlado y administrado por una sola computadora. TALLER BASE DE DATOS
Un sistema de multiprocesamiento puede administrar una base de datos pero lo hace usualmente a travs de un solo sistema de manejo de base de datos; los procesadores se utilizan para distribuir la carga de trabajo del sistema completo o incluso del propio SMBD pero actuando sobre una sola base de datos. Finalmente, una base de datos la cual reside en un solo sitio de una red de computadoras y que es accesada por todos los nodos de la red no es una base de datos distribuida
Este caso se trata de una base de datos cuyo control y administracin esta centralizada en un solo nodo pero se permite el acceso a ella a travs de la red de computadoras.
3. ARQUITECTURA DE LOS SISTEMAS DE BASES DE DATOS Hay tres caractersticas importantes inherentes a los sistemas de bases de datos: la separacin entre los programas de aplicacin y los datos, el manejo de mltiples vistas por parte de los usuarios y el uso de un catlogo para almacenar el esquema de la base de datos. En 1975, el comit ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements Committee) propuso una arquitectura de tres niveles para los sistemas de bases de datos, que resulta muy til a la hora de conseguir estas tres caractersticas. TALLER BASE DE DATOS
El objetivo de la arquitectura de tres niveles es el de separar los programas de aplicacin de la base de datos fsica. En esta arquitectura, el esquema de una base de datos se define en tres niveles de abstraccin distintos: 1. En el nivel interno se describe la estructura fsica de la base de datos mediante un esquema interno. Este esquema se especifica mediante un modelo fsico y describe todos los detalles para el almacenamiento de la base de datos, as como los mtodos de acceso. 2. En el nivel conceptual se describe la estructura de toda la base de datos para una comunidad de usuarios (todos los de una empresa u organizacin), mediante un esquema conceptual. Este esquema oculta los detalles de las estructuras de almacenamiento y se concentra en describir entidades, atributos, relaciones, operaciones de los usuarios y restricciones. En este nivel se puede utilizar un modelo conceptual o un modelo lgico para especificar el esquema. 3. En el nivel externo se describen varios esquemas externos o vistas de usuario. Cada esquema externo describe la parte de la base de datos que interesa a un grupo de usuarios determinado y oculta a ese grupo el resto de la base de datos. En este nivel se puede utilizar un modelo conceptual o un modelo lgico para especificar los esquemas. La mayora de los SGBD no distinguen del todo los tres niveles. Algunos incluyen detalles del nivel fsico en el esquema conceptual. En casi todos los SGBD que se manejan vistas de usuario, los esquemas externos se especifican con el mismo modelo de datos que describe la informacin a nivel conceptual, aunque en algunos se pueden utilizar diferentes modelos de datos en los niveles conceptual y externo. Hay que destacar que los tres esquemas no son ms que descripciones de los mismos datos pero con distintos niveles de abstraccin. Los nicos datos que existen realmente estn a nivel fsico, almacenados en un dispositivo como puede ser un disco. En un SGBD basado en la arquitectura de tres niveles, cada grupo de usuarios hace referencia exclusivamente a su propio esquema externo. Por lo tanto, el SGBD debe transformar cualquier peticin expresada en trminos de un esquema externo a una peticin expresada en trminos del esquema conceptual, y luego, a una peticin en el esquema interno, que se procesar sobre la base de datos almacenada. Si la peticin es de una obtencin (consulta) de datos, ser preciso modificar el formato de la informacin extrada de la base de datos almacenada, para que coincida con la vista externa del usuario. El proceso de transformar peticiones y resultados de un nivel a otro se TALLER BASE DE DATOS
denomina correspondencia o transformacin. Estas correspondencias pueden requerir bastante tiempo, por lo que algunos SGBD no cuentan con vistas externas. La arquitectura de tres niveles es til para explicar el concepto de independencia de datos que podemos definir como la capacidad para modificar el esquema en un nivel del sistema sin tener que modificar el esquema del nivel inmediato superior. Se pueden definir dos tipos de independencia de datos: La independencia lgica es la capacidad de modificar el esquema conceptual sin tener que alterar los esquemas externos ni los programas de aplicacin. Se puede modificar el esquema conceptual para ampliar la base de datos o para reducirla. Si, por ejemplo, se reduce la base de datos eliminando una entidad, los esquemas externos que no se refieran a ella no debern verse afectados. La independencia fsica es la capacidad de modificar el esquema interno sin tener que alterar el esquema conceptual (o los externos). Por ejemplo, puede ser necesario reorganizar ciertos ficheros fsicos con el fin de mejorar el rendimiento de las operaciones de consulta o de actualizacin de datos. Dado que la independencia fsica se refiere slo a la separacin entre las aplicaciones y las estructuras fsicas de almacenamiento, es ms fcil de conseguir que la independencia lgica. En los SGBD que tienen la arquitectura de varios niveles es necesario ampliar el catlogo o diccionario, de modo que incluya informacin sobre cmo establecer la correspondencia entre las peticiones de los usuarios y los datos, entre los diversos niveles. El SGBD utiliza una serie de procedimientos adicionales para realizar estas correspondencias haciendo referencia a la informacin de correspondencia que se encuentra en el catlogo. La independencia de datos se consigue porque al modificarse el esquema en algn nivel, el esquema del nivel inmediato superior permanece sin cambios, slo se modifica la correspondencia entre los dos niveles. No es preciso modificar los programas de aplicacin que hacen referencia al esquema del nivel superior. Por lo tanto, la arquitectura de tres niveles puede facilitar la obtencin de la verdadera independencia de datos, tanto fsica como lgica. Sin embargo, los dos niveles de correspondencia implican un gasto extra durante la ejecucin de una consulta o de un programa, lo cual reduce la eficiencia del SGBD. Es por esto que muy pocos SGBD han implementado esta arquitectura completa. TALLER BASE DE DATOS
4.
Ventajas: Procesadores ms poderosos y a menos costos Desarrollo de Estaciones con ms capacidades Las estaciones satisfacen las necesidades de los usuarios. Uso de nuevas interfaces. Avances en la Tecnologa de Comunicaciones. Disponibilidad de elementos de Comunicacin. Desarrollo de nuevas tcnicas. Comparticin de Recursos. Dispositivos (Hardware). Programas (Software). Eficiencia y Flexibilidad. Respuesta Rpida. Ejecucin Concurrente de procesos (En varias computadoras). Empleo de tcnicas de procesamiento distribuido. Disponibilidad y Confiabilidad. Sistema poco propenso a fallas (Si un componente no afecta a la disponibilidad del sistema). Mayores servicios que elevan la funcionalidad ( Monitoreo, Telecontrol, Correo Elctrico, Etc.). Crecimiento Modular. Es inherente al crecimiento. Inclusin rpida de nuevos recursos. Los recursos actuales no afectan.
Desventajas:
Requerimientos de mayores controles de procesamiento. Velocidad de propagacin de informacin (Muy lenta a veces). Servicios de replicacin de datos y servicios con posibilidades de fallas. Mayores controles de acceso y proceso (Commit). Administracin ms compleja. Costos.
5.
TALLER BASE DE DATOS
B.D. DISTRIBUIDA B.D. CENTRALIZADA DIFERENCIAS Todos los componentes del sistema residen en un solo computador o sitio. Los componentes consisten en los datos, el software del Sistema de Manejador de Bases de Datos SMBD y los dispositivos de almacenamiento secundario asociados, como discos para el almacenamiento en lnea de la base de datos y cintas para las copias de seguridad. Se pueden tener acceso remoto a una base de datos centralizada a travs de terminales conectadas al sitio; los datos y el software del SMBD residen principalmente en un solo sitio... La base de datos est almacenada en varias computadoras conectadas en red. Surgen debido a la existencia fsica de organismos descentralizados. Esto les da la capacidad de unir las bases de datos de cada localidad y acceder as a distintas universidades, sucursales Un solo punto de control de los clientes para la Web y lnea de comandos. La vista del explorador permite la administracin de trabajos, calendarios, etc. Los flujos de trabajos se pueden editar y controlar en el diseo grfico. Los objetos son organizados en una jerarqua de archivo/directorio. Grupo de comandos intuitivo. Optimiza el procesamiento automatizado que permite que se lleve a cabo ms trabajo sin intervencin. Reduce el costo de personal al permitir que los empleados se enfoquen en tareas que consuman menos tiempo y sean menos repetitivas. Inicia trabajos basados en tiempo o eventos reduciendo posibles errores humanos. Reduce los costos de operacin al eliminar la programacin manual de procesos repetitivos y trabajosos. Centraliza la gestin de tareas programadas por toda la empresa. Realiza tareas rutinarias de mantenimiento del sistema y de procesamiento de datos fuera de horas. TALLER BASE DE DATOS
de tiendas, etcetera.
En un sistema distribuido, las computadoras de proceso, residen muchas veces en las reas de trabajo de los usuarios En un sistema centralizado/distribuido existe un administrador que controla la base de datos El procesamiento de Bases de Datos Centralizadas es fcil de controlar En un sistema centralizado/distribuido existe un administrador que controla la base de datos
6. . En que ambientes, se cuenta con un sistema de Bases de Datos distribuidos Un ambiente computacional se dice distribuido cuando sus programas o BDs estn ubicados en dos o ms computadores. 7. 1.Autonoma local. Los sitios en un sistema distribuido deben ser autnomos. La autonoma local significa que todas las operaciones en un sitio dado estn controladas por ese sitio; ningn sitio X debe depender de algn otro sitio Y para su operacin satisfactoria. La seguridad, integridad y representacin de almacenamiento de los datos locales permanecen bajo el control y jurisdiccin del sitio local. 2. No dependencia de un sitio central. La autonoma local implica que todos los sitios deben ser tratados como iguales. Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio maestro central para algn servicio central, tal que todo el sistema dependa de ese sitio central. Razones por las cuales no debera haber un sitio central: El sitio central puede ser un cuello de botella TALLER BASE DE DATOS
El sistema sera vulnerable; es decir, si el sitio central falla, tambin fallar todo el sistema 3. Operacin continua. Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad. Confiabilidad. La probabilidad de que el sistema est listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algn componente independiente. Disponibilidad. La probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un perodo especificado. 4. Independencia de ubicacin. Conocida tambin como transparencia de ubicacin. Los usuarios no tienen que saber dnde estn almacenados fsicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local. Esto simplifica los programas de los usuarios. En particular, permite que los datos emigren de un sitio a otro sin invalidar ninguno de estos programas o actividades. 5. Independencia de fragmentacin. Un sistema soporta la fragmentacin de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento fsico. La fragmentacin es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicacin donde son usados ms frecuentemente para que la mayora de las operaciones sean locales y se reduzca el trfico en la red. Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentacin alguna. 6. Independencia de replicacin. El sistema soporta replicacin de datos cuando un fragmento puede ser representado por muchas copias distintas, o rplicas, guardadas en muchos sitios distintos. Las rplicas son necesarias por dos razones principales: TALLER BASE DE DATOS
1. Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) Independencia de replicacin 2. Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras est disponible al menos una copia). Por supuesto, la principal desventaja de las rplicas es que al actualizarlas es necesario actualizar todas: el problema de la propagacin de la actualizacin.
7. Procesamiento de consultas distribuidas. La optimizacin es importante en un sistema distribuido que en uno centralizado, incluso mucho ms. El punto bsico es que en una consulta que involucra a varios sitios, habr muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente. 8. Administracin de transacciones distribuidas. Existen dos aspectos principales en la administracin de transacciones: control de recuperacin y control de la concurrencia. Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido. Ya que una sola transaccin puede involucrar la ejecucin de cdigo en muchos sitios. Administracin de transacciones distribuidas Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la transaccin no caiga en un bloqueo mortal (basado en el bloqueo). Para el control de la recuperacin, es necesario asegurarse que una transaccin dada sea atmica en el ambiente distribuido, el sistema TALLER BASE DE DATOS
debe por lo tanto asegurarse de que la transaccin sea confirmada o deshecha (se puede utilizar el protocolo de confirmacin de dos fases).
9. Independencia de hardware. Soporte para un gran nmero de mquinas diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una imagen del sistema nico. 10. Independencia de sistema operativo. Obviamente es necesario no slo tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de hardware, sino tambin ejecutarlo en diferentes plataformas de sistema operativo.
11. Independencia de red. Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es obviamente necesario tener la posibilidad de soportar tambin una variedad de redes de comunicacin distintas. 12. Independencia de DBMS. Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz. Aunque no tienen que ser necesariamente copias del mismo software DBMS. En otras palabras, sera posible que el sistema distribuido fuera heterogneo, al menos en cierto grado. Sera muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido.
8.
FRAGMENTACION VERTICAL (subdivisin de atributos en grupos) r1 EMPLEADOS:(apellidos, nombre, direccion, telefono, funcion, localizacin, extension) r2 TALLER BASE DE DATOS