You are on page 1of 9

Fundamentos Tericos de las Bases de Datos Distribuidas (BDD)

Qu es una Base de Datos?


Una Base de Datos es un fondo comn de informacin almacenada en una computadora para que
cualquier persona o programa autorizado pueda acceder a ella, independientemente de su
procedencia y del uso que haga. (Olga Pons, 2005, p.6).
Una Base de Datos (BD) es un conjunto de datos relacionados entre s, organizados y
estructurados, con informacin referente a algo. Podremos utilizar una base de datos para cosas
tan sencillas como mantener un registro de nuestra agenda personal de telfonos, o tan
complicadas como llevar toda la gestin de una gran empresa u organizacin. (Ramos Marn, 2007,
p.2).
Las bases de datos son tratadas utilizando los Sistemas Gestores de Bases de Datos o SGBD,
tambin llamados DBMS {Database Management System), que proporcionan un conjunto de
programas que acceden y gestionan esos datos.
Un sistema de base de datos distribuida consiste en una coleccin de sitios, conectados por
medio de algn tipo de red de comunicacin, en el cual
a. cada sitio es un sistema de base de datos completo por derecho propio, pero
b. los sitios han acordado trabajar juntos, a fin de que un usuario de cualquier sitio pueda
acceder a los datos desde cualquier lugar de la red, exactamente como si los datos
estuvieran guardados en el propio sitio del usuario.
De aqu deducimos que la llamada "base de datos distribuida es en realidad un tipo de base de
datos virtual cuyas partes componentes estn almacenadas en varas bases de datos "reales"
distintas que se encuentran en varios sitios distintos (de hecho, es la unin lgica de esas bases de
datos reales). (C. J. Date, Sergio Luis Mara Ruiz Faudn, 2001, p. 651).
Tipos de Bases de Datos
Dentro de las mltiples clasificaciones que se pueden hacer, procederemos a clasificar las bases de
datos de la manera ms general, esto es, por la variabilidad de los datos almacenados y por los
tipos de modelos de datos.
Teniendo en cuenta la variabilidad de los datos almacenados, estableceremos bases de datos
estticas y dinmicas.
Las bases de datos estticas hacen referencia a bases de datos de slo lectura. Se
emplean, primordialmente, para almacenar datos histricos que posteriormente se
pueden revisar y utilizar para extraer pautas y comportamientos a travs del tiempo,
realizar proyecciones, planes y tomas de decisiones.
En las bases de datos dinmicas, la informacin almacenada se modifica con el tiempo,
estando permanentemente actualizada mediante insercin de nuevos datos y
mantenimiento. Este tipo englobara a casi la totalidad de las bases de datos utilizadas.
Segn el tipo de modelo de datos, existen fundamentalmente tres alternativas o vas disponibles:
el modelo jerrquico, el modelo de red y el modelo relacional.
El modelo jerrquico puede representar dos tipos de relaciones entre los datos: relaciones
de uno a uno y relaciones de uno a varios.
El modelo de red permite la representacin de muchos a muchos, de tal forma que
cualquier registro dentro de la base de datos puede tener varias ocurrencias superiores a
l. El modelo de red evita redundancia en la informacin a travs de la incorporacin de
un tipo de registro denominado conector.
El modelo relacional resulta ser el ms empleado en la prctica debido a las ventajas que
presenta con respecto a los modelos anteriores. Entre todas ellas, se encuentra: la rapidez
de entendimiento por parte de aquellos usuarios que no tienen conocimientos profundos
sobre sistemas de bases de datos; la rapidez; y gran operatividad del sistema en s.
Por ltimo, en esta clasificacin, es posible incluir las bases de datos distribuidas.
Son bases que se encuentran almacenadas en varias computadoras o servidores conectados en
red. Su origen se debe a la existencia de una serie de organismos cuya situacin tsica impide la
centralizacin de una nica base de datos. De esta forma, se proporciona la capacidad de unir las
bases de datos de cada lugar o localidad y acceder as a distintos ayuntamientos, universidades,
sucursales bancarias, etc.
Las tendencias futuras en sistemas de bases de datos estn orientadas a un cambio en el manejo
de la informacin y en la arquitectura de las mismas. La programacin de aplicaciones cliente-
servidor y aplicaciones web obligan al alojamiento de una base de datos relacional en un servidor
cuyo acceso se realiza a travs de terminales para la solicitud de la informacin necesaria. Por
tanto, la simplicidad en el acceso a las aplicaciones y la rapidez de las conexiones y
comunicaciones sern las causas que sentarn las bases de las caractersticas de las bases de datos
futuras.
Qu es un Sistema Manejador de Base de Datos (SMBD)?
Un DBMS (Database Management System) (o SMBD, Sistema Manejador de Bases de Datos) es
una coleccin de programas que permite a los usuarios crear y mantener bases de datos.
Es un software de propsito general que facilita los procesos de definicin (especificacin de
estructuras de almacenamiento, tipos de datos y restricciones), construccin (almacenamiento de
los datos en algn medio) y manipulacin (consultas y actualizacin) de las bases de datos para ser
usadas en diversas aplicaciones. Un DBMS tambin puede ser de propsito especial cuando est
hecho para manipular bases de datos que tienen un propsito especfico.
Un lenguaje de 4a generacin, tambin conocido como 4GL, es un lenguaje de programacin con
un conjunto poderoso de instrucciones que permite crear aplicaciones que manipulan las bases de
datos. Actualmente estos lenguajes incluyen elementos para manejar en forma grfica la
informacin de una base de datos. Visual Basic o Java son ejemplos de este tipo de lenguaje de
programacin. Con un 4GL se pueden construir aplicaciones constituidas por formularlos,
informes, mens y otros elementos visuales que utilicen el contenido de una base de datos a fin
de satisfacer las necesidades de los usuarios.
A la unin de la base de datos con el software que la manipula se le llama sistema o aplicacin de
base de datos.
Componentes del SMBD
Un DBMS es un sistema de software grande y complejo. A continuacin se describen brevemente
las partes importantes de un DBMS.
El catlogo del sistema es una mini-base de datos almacenada en disco que puede estar
separada fsicamente o no de las bases de datos controladas por el DBMS. Contiene
informacin como nombres de archivos, campos de datos, tipos de datos, detalles de
almacenamiento, informacin de transformacin entre niveles y restricciones.
El compilador DDL procesa las definiciones de las estructuras de la base de datos y
almacena sus descripciones (meta-datos) en el catlogo.
El compilador DML analiza y traduce las instrucciones ejecutables de SQL. Normalmente
genera llamados al procesador run-time para que ste las ejecute.
El administrador de datos controla el acceso a la informacin almacenada en disco, ya sea
que forme parte de una liase de tintos o del anlogo. Usa servicios del sistema operativo
para intercambiar datos entre disco y memoria central.
El procesador run-time recibe operaciones de recuperacin y de actualizacin y las
ejecuta sobre la base de datos, para lo cual se apoya en el administrador de datos.
El subsistema de control de concurrencia controla el acceso simultneo a una base de
datos realizado por varios usuarios.
El subsistema de seguridad restringe el acceso a la base de flatos para usuarios no
autorizados y restringe el acceso a panes de la base de datos que slo un determinado
grupo de usuarios puede usar.
El subsistema de respaldo/recuperacin permite crear respaldos de las bases de datos en
otro(s) dispositivo(s) para poder recuperar la informacin en caso de una falla catastrfica.

Tipos de Archivos del SMBD
Como mnimo, todas las bases de datos de SQL Server tienen dos archivos del sistema operativo:
un archivo de datos y un archivo de registro. Los archivos de datos contienen datos y otros
objetos, como tablas, ndices, procedimientos almacenados y vistas. Los archivos de registro
contienen la informacin necesaria para recuperar todas las transacciones de la base de datos. Los
archivos de datos se pueden agrupar en grupos de archivos para su asignacin y administracin.
Archivos de la base de datos
Las bases de datos de SQL Server tienen tres tipos de archivos, tal como se muestra en la tabla
siguiente.
Primario
El archivo de datos principal incluye la informacin de inicio de la base de datos y apunta a
los dems archivos de la misma. Los datos y objetos del usuario se pueden almacenar en
este archivo o en archivos de datos secundarios. Cada base de datos tiene un archivo de
datos principal. La extensin recomendada para los nombres de archivos de datos
principales es .mdf.
Secundario
Los archivos de datos secundarios son opcionales, estn definidos por el usuario y
almacenan los datos del usuario. Se pueden utilizar para distribuir datos en varios discos
colocando cada archivo en una unidad de disco distinta. Adems, si una base de datos
supera el tamao mximo establecido para un archivo de Windows, puede utilizar los
archivos de datos secundarios para permitir el crecimiento de la base de datos.
La extensin de nombre de archivo recomendada para archivos de datos secundarios es
.ndf.
Registro de:
Los archivos del registro de transacciones contienen la informacin de registro.
Por ejemplo, puede crearse una base de datos sencilla denominada Ventas con un archivo
principal que contenga todos los datos y objetos y un archivo de registro con la informacin del
registro de transacciones. Por otra parte, puede crearse una base de datos ms compleja, Pedidos,
compuesta por un archivo principal y cinco archivos secundarios. Los datos y objetos de la base de
datos se reparten entre los seis archivos, y cuatro archivos de registro adicionales contienen la
informacin del registro de transacciones.
De forma predeterminada, los datos y los registros de transacciones se colocan en la misma
unidad y ruta de acceso para administrar los sistemas de un solo disco, pero puede que esto no
resulte ptimo para los entornos de produccin. Se recomienda colocar los archivos de datos y de
registro en distintos discos.
Grupos de archivos
Cada base de datos tiene un grupo de archivos principal. Este grupo de archivos contiene el
archivo de datos principal y cualquier otro archivo secundario que no se encuentre en otro grupo
de archivos. Se pueden crear grupos de archivos definidos por el usuario para agrupar archivos con
fines administrativos y de asignacin y ubicacin de datos.
Todos los archivos de datos se almacenan en los grupos de archivos que se indican en la tabla
siguiente.
Primario
Grupo de archivos que contienen el archivo principal. Todas las tablas del sistema se
asignan al grupo de archivos principal.
Definido por el usuario
Cualquier grupo de archivos creado especficamente por el usuario al crear la base de
datos o al modificarla.
Grupo de archivos predeterminado
Cuando se crean objetos en la base de datos sin especificar a qu grupo de archivos pertenecen,
se asignan al grupo de archivos predeterminado. Siempre existe un grupo de archivos designado
como predeterminado. Los archivos del grupo de archivos predeterminado deben ser lo
suficientemente grandes como para dar cabida a todos los objetos nuevos no asignados a otros
grupos de archivos.
El grupo de archivos PRINCIPAL es el predeterminado, a menos que se cambie mediante la
instruccin ALTER DATABASE. Los objetos y las tablas del sistema no se asignan al nuevo grupo de
archivos predeterminado, sino que siguen asignados al grupo de archivos PRIMARY.
Arquitectura cliente-servidor
La arquitectura cliente-servidor es una arquitectura en la que el sistema de base de datos se divide
en dos partes: el servidor (llamado tambin parte dorsal, en ingls back end, o servicios de fondo)
y los clientes (llamados tambin partes frontales, en ingls front end, aplicaciones o interfaces).
El servidor est formado precisamente por el DBMS, llevando a cabo la administracin y la
manipulacin de las bases de datos que controla. Los clientes son las diversas aplicaciones que
trabajan con la informacin que est en las bases de datos, tanto aplicaciones escritas por usuarios
como aplicaciones integradas (proporcionadas por el fabricante de DBMS o por terceros). Los
clientes hacen peticiones al servidor (el DBMS), ste las recibe y las procesa, y enva las respuestas
de vuelta a los clientes.
Aunque esta arquitectura se puede seguir si estn todos los componentes del sistema en una
misma computadora, por lo general el trmino cliente-servidor se aplica cuando los clientes se
ubican en sitios (computadoras) distintos al del servidor. Es comn usar computadoras personales
o estaciones de trabajo sencillas del lado de los clientes, y estaciones de trabajo poderosas o
mainframes del lado del servidor. Debe existir una red y software de comunicacin para que los
clientes y el servidor puedan intercambiar informacin y as poder implementar este tipo de
arquitectura.


Caractersticas de una Base de Datos Distribuida (BDD)
El principio fundamental de las bases de datos distribuidas consiste en que los usuarios debern
comportarse exactamente igual como si el sistema no estuviera distribuido. A este principio
tambin se le conoce como "regla cero de los sistemas distribuidos", el cual conduce a 12 reglas
secundarias, las cuales son las siguientes:
1. Autonoma local. Las localidades deben ser autnomas; es decir, que todas las operaciones
realizadas en una localidad sean controladas en esta misma localidad. Es necesario sealar que
una localidad no puede ser totalmente autnoma, ya que existen varias situaciones en las
cuales una de ellas debe ceder el control a otra, perdiendo as, parte de su autonoma.

2. No dependencia de una localidad central. Este principio es un corolario del primero. Es
indeseable la dependencia de una localidad central por dos razones: primero, el sistema sera
vulnerable si la localidad central sufriera un desperfecto, y segundo, la localidad central
llegara a ser un cuello de botella.

3. Operacin continua. Se refiere a que el sistema nunca deber necesitar suspenderse para
realizar alguna funcin, como puede ser aadir una nueva localidad o instalar la versin
mejorada del sistema administrador de base de datos. Es decir, el sistema deber mantener su
funcionamiento de manera constante.

4. Independencia con respecto a la localizacin (tambin conocida como transparencia de
localizacin). Para los usuarios, el sistema deber comportarse como si todos los datos
estuvieran almacenados en su propia localidad, esto simplifica la realizacin del trabajo a los
usuarios, ya que no requieren conocer dnde se encuentran almacenados fsicamente los
datos.

5. Independencia con respecto a la fragmentacin. La fragmentacin se refiere a la divisin
fsica de los datos de una tabla, la cual es deseable por razones de desempeo, de tal forma
que los datos pueden almacenarse en la localidad donde sean ms utilizados, con el fin de
reducir el trfico de la red y proporcionar un mejor servicio de acceso a la informacin.

6. Independencia de rplica (tambin llamada transparencia de rplica). Consiste en que, desde
el punto de vista del usuario, la informacin se encuentra en una sola base de datos sin estar
consciente del posible uso de una rplica de la misma. Esto es importante, ya que las
aplicaciones pueden operar sobre copias locales en vez de tener que comunicarse con
localidades remotas, mejorando la disponibilidad de la informacin. La desventaja principal de
las rplicas consiste en que al realizar una transaccin en una de ellas, sta deber actualizarse
en todas las dems rplicas.

7. Procesamiento distribuido de consultas. La realizacin de consultas en una base de datos
distribuida implica la transmisin de mensajes entre las localidades. La optimizacin del
procesamiento distribuido de consultas se ve afectada por la manera como los datos son
transmitidos desde una local dad inicial a una localidad final.

8. Manejo distribuido de transacciones. El manejo de transacciones cuenta con dos aspectos
principales: el control de recuperacin y el control de concurrencia. En el control de
recuperacin, para asegurarse de la atomicidad de una transaccin, el sistema deber verificar
que todas las operaciones correspondientes a esa transaccin se comprometan (realicen
commit), o bien, retrocedan (realicen rollback) a un mismo tiempo; esto se lleva a cabo
mediante el protocolo de commit a dos fases. El control de concurrencia se realiza mediante la
utilizacin de bloqueos.

9. Independencia con respecto al equipo. Debido a la gran variedad de equipos que existen, es
conveniente poder integrar los datos en diferentes equipos, y lograr que el usuario vea la
informacin como si fuera un solo conjunto de datos almacenado en una misma localidad.
Esto se logra al ejecutar el mismo sistema administrador de base de datos en diferentes
equipos.

10. Independencia con respecto al sistema operativo. As como existe una gran variedad de
equipos, tambin existen en el mercado diversos sistemas operativos, por lo cual este
principio seala la importancia de ejecutar el mismo sistema administrador de base de datos
en diferentes sistemas operativos.

11. Independencia con respecto a la red. Si es posible que el sistema funcione con equipos
diferentes, sistemas operativos diversos y mltiples localidades, tambin es conveniente
poder manejar varas redes de comunicacin distintas. La red de comunicacin utilizada
influir en la velocidad en que los datos sean transmitidos, por lo tanto, resulta importante
elegir el medio de comunicacin ms ptimo.

12. Independencia con respecto al sistema administrador de la base de datos. En un sistema de
base de datos distribuida, no es necesario contar con los mismos sistemas administradores de
bases de datos, slo es necesario contar con la misma interfaz. Por ejemplo, si tanto Ingres
como Oracle manejan la norma oficial de sol, podra ser posible lograr una comunicacin entre
las dos localidades; es decir, el sistema distribuido podr ser heterogneo hasta cierto grado.
Un sistema distribuido ideal deber cumplir este principio.

Ejemplos
Los ambientes en los que se encuentra con mayor frecuencia el uso de las bases de datos
distribuidas son:
Cualquier organizacin que tiene una estructura descentralizada.
Casos tpicos de lo anterior son: organismos gubernamentales y/o de servicio pblico.
La industria de la manufactura, particularmente, aquella con plantas mltiples. Por ejemplo, la
industria automotriz.
Aplicaciones de control y comando militar.
Lneas de transportacin area.
Cadenas hoteleras.
Servicios bancarios y financieros.
Bibliografa

Olga Pons, Nicols Marn, Juan Miguel Medina, Silvia Acid, Ma. Amparo Vila
Introduccin a las Bases de Datos
Editorial Paraninfo, 2005
296 pginas.
Alicia Ramos Martn, Mara Jess Ramos Martn
Operaciones con Bases de Datos Ofimticas y Corporativas
Editorial Paraninfo, 2007
393 pginas.
C. J. Date, Sergio Luis Mara Ruiz Faudn
Introduccin a los Sistemas de Base de Datos
Pearson Educacin, 2001
936 pginas.
Jos Luis Cisneros Gonzles
Panorama sobre Bases de Datos (Un enfoque prctico)
Universidad Autnoma de Baja California, 1998
249 pginas.
Andrs Gmez de Silva Garza, Ignacio de Jess Ania Briseo
Introduccin a la Computacin
Cengage Learning Editores, 2008
522 pginas.
Carlos Fernndez Prez, Ana Riascos Lomato, Antn Mara Rodrguez Yuste
Utilizacin de herramientas ofimticas: Gua prctica para el manejo de un procesador de textos,
una base de datos y una hoja de clculo.
Ideaspropias Editorial, 2010
200 pginas.

You might also like