You are on page 1of 33

GESTORES DE BASE DE DATOS

CURSO DE BASE DE DATOS

1. Introduccin
}

Un archivo es un elemento de informacin conformado por un conjunto de registros. Estos registros a su vez estn compuestos por una serie de caracteres o bytes. Los archivos, alojados en dispositivos de almacenamiento conocidos como memoria secundaria, pueden almacenarse de dos formas diferentes: archivos convencionales o bases de datos. Los archivos convencionales, pueden organizarse como archivos secuenciales o archivos directos. Sin embargo, el almacenamiento de informacin a travs de archivos convencionales presenta una serie de limitaciones que restringen de manera importante la versatilidad de los programas de aplicacin que se desarrollan.

2. Archivos convencionales
}

El uso de sistemas de informacin por parte de las organizaciones requiere el almacenamiento de grandes cantidades de informacin, ya sea para el uso mismo del sistema, para generar resultados o para compartir dicha informacin con otros sistemas. Las formas en las cuales pueden organizarse son archivos secuenciales o archivos directos. En los archivos secuenciales los registros estn almacenados en una secuencia que depende de algn criterio definido. Por ejemplo, pueden almacenarse los registros de los empleados de la empresa de manera secuencial de acuerdo al departamento al que pertenecen o de acuerdo a su antigedad. Si se desea consultar o modificar informacin, tambin es necesario buscar uno por uno en los registros hasta encontrarla. Los archivos directos permiten accesar directamente un registro de informacin sin tener que buscar uno a uno por todos los registros del archivo, utilizando una llave de acceso dentro del archivo.

3. Definicin de Base de Datos


}

Se define una base de datos como una serie de datos organizados y relacionados entre s, los cuales son recolectados y explotados por los sistemas de informacin de una empresa o negocio en particular. Las bases de datos proporcionan la infraestructura requerida para los sistemas de apoyo a la toma de decisiones y para los sistemas de informacin estratgicos, ya que estos sistemas explotan la informacin contenida en las bases de datos de la organizacin para apoyar el proceso de toma de decisiones o para lograr ventajas competitivas. Por este motivo es importante conocer la forma en que estn estructuradas las bases de datos y su manejo.

Base de Datos

4. Componentes principales
} }

Datos. Los datos son la Base de Datos propiamente dicha. Hardware. El hardware se refiere a los dispositivos de almacenamiento en donde reside la base de datos, as como a los dispositivos perifricos (unidad de control, canales de comunicacin, etc.) necesarios para su uso. Software. Est constituido por un conjunto de programas que se conoce como Sistema Manejador de Base de Datos (DMBS: Data Base Management System). Este sistema maneja todas las solicitudes formuladas por los usuarios a la base de datos. Usuarios. Existen tres clases de usuarios relacionados con una Base de Datos: El programador de aplicaciones, quien crea programas de aplicacin que utilizan la base de datos. El usuario final, quien accesa la Base de Datos por medio de un lenguaje de consulta o de programas de aplicacin. El administrador de la Base de Datos (DBA: Data Base Administrator), quien se encarga del control general del Sistema de Base de Datos.

} }

5. Ventajas en el uso de Bases de Datos.


}

Globalizacin de la informacin. Permite a los diferentes usuarios considerar la informacin como un recurso corporativo que carece de dueos especficos. Eliminacin de informacin redundante. Duplicada Eliminacin de informacin inconsistente. Si el sistema esta desarrollado a travs de archivos convencionales, dicha cancelacin deber operarse tanto en el archivo de facturas del Sistema de Control de Cobranza como en el archivo de facturas del Sistema de Comisiones. Permite compartir informacin. Varios sistemas o usuarios pueden utilizar una misma entidad. Permite mantener la integridad en la informacin. Solo se almacena la informacin correcta. Independencia de datos. La independencia de datos implica un divorcio entre programas y datos; es decir, se pueden hacer cambios a la informacin que contiene la base de datos o tener acceso a la base de datos de diferente manera, sin hace cambios en las aplicaciones o en los programas.

} }

6. El sistema organizador de Base de Datos (DBMS)


}

El DBMS es un conjunto de programas que se encargan de manejar la creacin y todos los accesos a las bases de datos. Se compone de un lenguaje de definicin de datos (DDL: Data Definition Language), de un lenguaje de manipulacin de datos (DML: Data Manipulation Language) y de un lenguaje de consulta (SQL: Structured Query Language). El lenguaje de definicin de datos (DDL) es utilizado para describir todas las estructuras de informacin y los programas que se usan para construir, actualizar e introducir la informacin que contiene una base de datos. El lenguaje de manipulacin de datos (DML) es utilizado para escribir programas que crean, actualizan y extraen informacin de las bases de datos. El lenguaje de consulta (SQL) es empleado por el usuario para extraer informacin de la base de datos. El lenguaje de consulta permite al usuario hacer requisiciones de datos sin tener que escribir un programa, usando instrucciones como el SELECT, el PROJECT y el JOIN. La secuencia conceptual de operaciones que ocurren para acceder cierta informacin que contiene una base de datos es la siguiente: 1 El usuario solicita cierta informacin contenida en la base de datos. El DBMS intercepta este requerimiento y lo interpreta. El DBMS realiza las operaciones necesarias para acceder y/o actualizar la informacin solicitada.

7. El administrador de la Base de Datos (DBA)


} El

DBA es la persona encargada de definir y controlar las bases de datos corporativas, adems proporciona asesora a los usuarios y ejecutivos que la requieran

8. Tipos de modelos de Datos


} Existen

fundamentalmente tres alternativas disponibles para disear las bases de datos: el modelo jerrquico, el modelo de red y el modelo relacional.

El modelo jerrquico
}

La forma de esquematizar la informacin se realiza a travs de representaciones jerrquicas o relaciones de padre/hijo, de manera similar a la estructura de un rbol. As, el modelo jerrquico puede representar dos tipos de relaciones entre los datos: relaciones de uno a uno y relaciones de uno a muchos. En el primer tipo se dice que existe una relacin de uno a uno si el padre de la estructura de informacin tiene un solo hijo y viceversa, si el hijo tiene solamente un padre. En el segundo tipo se dice que la relacin es de uno a muchos si el padre tiene ms de un hijo, aunque cada hijo tenga un solo padre. Inconveniente del modelo jerrquico Relacin maestro-alumno, donde un maestro tiene varios alumnos, pero un alumno tambin tiene varios maestros, uno para cada clase. En este caso, si la informacin estuviera representada en forma jerrquica donde el padre es el maestro y el alumno es el hijo, la informacin del alumno tendr que duplicarse para cada uno de los maestros. Otra dificultad que presenta el modelo jerrquico de representacin de datos es respecto a las bajas. En este caso, si se desea dar de baja a un padre, esto necesariamente implicar dar de baja a todos y cada uno de los hijos que dependen de este padre.

} }

Modelo jerarquico

El modelo de red
}

El modelo de red evita esta redundancia en la informacin, a travs de la incorporacin de un tipo de registro denominado el conector, que en este caso pueden ser las calificaciones que obtuvieron los alumnos de cada profesor. La dificultad surge al manejar las conexiones o ligas entre los registros y sus correspondientes registros conectores. El modelo de red evita esta redundancia en la informacin, a travs de la incorporacin de un tipo de registro denominado el conector, que en este caso pueden ser las calificaciones que obtuvieron los alumnos de cada profesor. La dificultad surge al manejar las conexiones o ligas entre los registros y sus correspondientes registros conectores.

Modelo de red

El modelo relacional
}

Se est empleando con ms frecuencia en la prctica, debido el rpido entendimiento por parte de los usuarios que no tienen conocimientos profundos sobre Sistemas de Bases de Datos y a las ventajas que ofrece sobre los dos modelos anteriores. En este modelo toda la informacin se representa a travs de arreglos bidimensionales o tablas. Estas operaciones bsicas son: Seleccionar renglones de alguna tabla (SELECT) Seleccionar columnas de alguna tabla (PROJECT) Unir o juntar informacin de varias tablas (JOIN) Es importante mencionar que la mayora de los paquetes que manejan bases de datos disponibles en el mercado poseen las instrucciones SELECT, PROJECT Y JOIN con diferentes nombres y modalidades.

} } } } }

Modelo Relacional

9. Bases de Datos distribuidas


} Son

las Bases de Datos que no estn almacenadas totalmente en un solo lugar fsico, (esta segmentada) y se comunican por medio de enlaces de comunicaciones a travs de una red de computadoras distribuidas geogrficamente.

Tendencias futuras
} }

} } } }

. La explotacin efectiva de la informacin dar ventaja competitiva a las organizaciones. Las bases de datos orientadas a objetos empleadas para diseo y manufactura asistida por computadora CAD/CAM sern utilizados a un mismo nivel que las Bases se Datos relacionales de la actualidad. Los lenguajes de consulta (SQL) permitirn el uso del lenguaje natural para solicitar informacin de la Base de Datos, haciendo ms rpido y fcil su manejo. Algunas Bases de Datos SQL, ORACLE, DBASE, IV, FOXPRO, FOXBASE, PARADOS, ACCES, APPROACH. Bibliografa Sistemas de informacin para la toma de decisiones autor Daniel Cohen Mc Graw Hill

LOS DBMS Sistemas Administradores de Bases de Datos Evolucin


}

Inicialmente, en los aos 40s, los Sistemas de Archivos generados a travs de lenguajes de programacin no propietarios como Cobol y Fortran (vigentes en la actualidad), permiten almacenar los datos a travs de archivos planos con funciones bsicas de lectura y escritura sobre ellos. En 1964, se conciben los primeros Gestores de Base de Datos (DBMS: Database Management System), por medio de los cuales se pretende dar un viraje a los Sistemas de Archivos, los cuales se limitan a la estructuracin del almacenamiento fsico de los datos. Con los DBMS se crea el concepto de Administracin de los datos, por medio de actividades integradas que permiten verlos fsicamente en un solo almacenamiento pero lgicamente se manipulan a travs de esquemas compuesto por estructuras donde se establecen vnculos de integridad, mtodos de acceso y organizacin fsica sobre los datos, permitiendo as obtener valores agregados de utilizacin tales como: manejo de usuarios, seguridad, atomicidad e independencia fsica y lgica de los datos, entre otros. El primer gestor de bases de datos (DBMS) comercial, IDS: Integrated Data Store , se crea bajo el concepto del Modelo de Datos de Red (Bachgman, 1965); luego se desarrolla el IMS: Information Management System , sobre el concepto del Modelo de Datos Jerrquico. Estos DBMSs eran accesados normalmente por lenguajes de programacin como Cobol usando interfases de bajo nivel haciendo que las tareas de creacin de aplicaciones y mantenimiento de los datos fuesen controlables, pero an complejas. A medida que evolucionaban los DBMS, los lenguajes de programacin tambin lo hacan. En 1967 surge el primer lenguaje de programacin orientado a objetos, Simula, el cual fue propuesto para simulacin de actividades. En este los procedimientos podan ser asociados a un tipo para representar el comportamiento de una instancia, introduciendo as el concepto de Clase. Simula, soporta paralelismo permitiendo muchas entidades interactivas en una simulacin. Adems comparte objetos acoplando datos y procedimientos.

Luego se genera una nueva nocin, donde las bases de datos deben almacenar por medio de una estructura tabular llamada relacin o tabla (Codd,1970), compuesta por filas y columnas, accesando dichas relaciones a travs de un lenguaje de alto nivel no procedural (declarativo). De esta forma en los aos 80s surgen varios productores de DBMS Relacionales (RDBMS) como Oracle, Informix, Ingres y DB2, adems de otros lenguajes orientados a objetos como el C++, Java (antes el Oak), Eiffel, y Smalltalk adoptando y mejorando el concepto de clase pero su desarrollo se hace independiente de los DBMSs. Comenzando los aos 80s ya se siente la necesidad de que los DBMS actuales manipulen objetos complejos y estructuras como las usadas en sistemas CAD y CASE, entre otras. A partir de esto se da inicio a dos grandes tendencias: los ORDBMS (Object Relational Database Management System) los cuales se proyectan como una extensin de los RDBMS hacia el paradigma OO, y los OODBMS (Object Oriented Database Management System) estaran disponibles para almacenar y manipular las clases, los objetos, la asociacin entre ellos y sus mtodos. As, finalizando los aos 80s se crean los OODBMSs por medio de productores como O2, ObjectDesign y Objectivity, entre otros. Pero realmente se puede decir que estos no se hicieron tan comerciales como los existentes RDBMS ya que el concepto de Orientacin a Objetos se segua manejando muy a nivel del lenguaje de programacin, sin que se trabajaran estructuras de almacenamiento Orientadas a Objetos dependientes de estos . As, en 1991 surge la ODMG (Object Database Management Group) el cual estandariza los OODBMSs a partir del ODMG-93 y luego en 1992 el comit ANSI X3H2 inicia un trabajo en SQL3, del cual surgen los DBMS objeto relacional ORDBMS. Este trabajo fue programado para finalizarse en 1995, pero an se sigue trabajando en este con un tiempo lmite de terminacin, en el ao 1999. Por medio de la tabla 1 se puede observar la clasificacin que se ha hecho de las versiones que han generado los diferentes vendedores de acuerdo a la evolucin de los modelos:

Esquema de un BDMS

Lenguajes del DBMS


} }

En la estructura bsica de un Sistema Manejador de Base de Datos se enuncian dos lenguajes que permiten trabajar sobre la base de datos. Estos lenguajes estndar son: DDL (Data Definicin lenguaje): Lenguaje de Definicin de Datos. Por medio de este el DBMS identifica las descripciones de los elementos de los esquemas y almacena la descripcin del esquema en el catlogo del DBMS. Por medio de este el DBMS especifica el esquema conceptual e interno (Base de datos Almacenada).

SDL (Store Definition lenguaje): Lenguaje de definicin de almacenamiento. Es utilizado por el DBMS para especificar el esquema interno que corresponde a la Base de Datos Almacenada. VDL (View Definicin lenguaje): Lenguaje de Definicin de Vistas. Es utilizado por el DBMS para especificar las vistas del usuario y sus correspondencias con el esquema conceptual. En las Bases de Datos Relacionales, el SQL, representa una combinacin de los anteriores. DML (Data Manipulacin lenguaje): Lenguaje de Manipulacin de Datos. Permite la manipulacin de las operaciones de Insercin, Eliminacin y Modificacin. } Tipos de DML's: } De alto Nivel o No por procedimientos: SQL. } De bajo Nivel o por procedimientos. Usuarios de un Sistema Manejador de Base de Datos Personal del DBA Usuarios Espordicos Programadores de Aplicaciones Usuarios paramtricos

} } } } } }

Un Sistema Gestor de Bases de Datos (SGBD) o DBMA (Data Base Management System)

Un Sistema Gestor de Bases de Datos (SGBD) o DBMA (Data Base Management System)
} } }

es una coleccin de programas cuyo objetivo es servir de interfaz entre la base de datos, el usuario y las aplicaciones. Se compone de un lenguaje de definicin de datos, de un lenguaje de manipulacin de datos y de un lenguaje de consulta. Un SGBD permiten definir los datos a distintos niveles de abstraccin y manipular dichos datos, garantizando la seguridad e integridad de los mismos. Algunos ejemplos de SGBD son Oracle, DB2, PostgreSQL, MySQL, MS SQL Server, etc. Un SGBD debe permitir: Definir una base de datos: especificar tipos, estructuras y restricciones de datos. Construir la base de datos: guardar los datos en algn medio controlado por el mismo SGBD Manipular la base de datos: realizar consultas, actualizarla, generar informes

} } }

Las caractersticas de un Sistema Gestor de Base de Datos SGBD son:


}

Abstraccin de la informacin. Los SGBD ahorran a los usuarios detalles acerca del almacenamiento fsico de los datos. Da lo mismo si una base de datos ocupa uno o cientos de archivos, este hecho se hace transparente al usuario. As, se definen varios niveles de abstraccin. Independencia. La independencia de los datos consiste en la capacidad de modificar el esquema (fsico o lgico) de una base de datos sin tener que realizar cambios en las aplicaciones que se sirven de ella. Redundancia mnima. Un buen diseo de una base de datos lograr evitar la aparicin de informacin repetida o redundante. De entrada, lo ideal es lograr una redundancia nula; no obstante, en algunos casos la complejidad de los clculos hace necesaria la aparicin de redundancias.

Consistencia. En aquellos casos en los que no se ha logrado esta redundancia nula, ser necesario vigilar que aquella informacin que aparece repetida se actualice de forma coherente, es decir, que todos los datos repetidos se actualicen de forma simultnea. Seguridad. La informacin almacenada en una base de datos puede llegar a tener un gran valor. Los SGBD deben garantizar que esta informacin se encuentra segurizada frente a usuarios malintencionados, que intenten leer informacin privilegiada; frente a ataques que deseen manipular o destruir la informacin; o simplemente ante las torpezas de algn usuario autorizado pero despistado. Normalmente, los SGBD disponen de un complejo sistema de permisos a usuarios y grupos de usuarios, que permiten otorgar diversas categoras de permisos.

Integridad. Se trata de adoptar las medidas necesarias para garantizar la validez de los datos almacenados. Es decir, se trata de proteger los datos ante fallos de hardware, datos introducidos por usuarios descuidados, o cualquier otra circunstancia capaz de corromper la informacin almacenada.

Respaldo y recuperacin. Los SGBD deben proporcionar una forma eficiente de realizar copias de respaldo de la informacin almacenada en ellos, y de restaurar a partir de estas copias los datos que se hayan podido perder. Control de la concurrencia. En la mayora de entornos (excepto quizs el domstico), lo ms habitual es que sean muchas las personas que acceden a una base de datos, bien para recuperar informacin, bien para almacenarla. Y es tambin frecuente que dichos accesos se realicen de forma simultnea. As pues, un SGBD debe controlar este acceso concurrente a la informacin, que podra derivar en inconsistencias.

Arquitectura de los sistemas de bases de datos


} En

1975, el comit ANSI-SPARC (American National Standard Institute - Standards Planning and Requirements Committee) propuso una arquitectura de tres niveles para los SGBD cuyo objetivo principal era el de separar los programas de aplicacin de la BD fsica. En esta arquitectura el esquema de una BD se define en tres niveles de abstraccin distintos:

Nivel interno o fsico


}

el ms cercano al almacenamiento fsico, es decir, tal y como estn almacenados en el ordenador. Describe la estructura fsica de la BD mediante un esquema interno. Este esquema se especifica con un modelo fsico y describe los detalles de cmo se almacenan fsicamente los datos: Los archivos que contienen la informacin, su organizacin, los mtodos de acceso a los registros, los tipos de registros, la longitud, los campos que los componen, etctera.

Nivel externo o de visin


}

Es el ms cercano a los usuarios, es decir, es donde se describen varios esquemas externos o vistas de usuarios. Cada esquema describe la parte de la BD que interesa a un grupo de usuarios en este nivel se representa la visin individual de un usuario o de un grupo de usuarios.

Nivel conceptual
la estructura de toda la BD para un grupo de usuarios mediante un esquema conceptual. Este esquema describe las entidades, atributos, relaciones, operaciones de los usuarios y restricciones, ocultando los detalles de las estructuras fsicas de almacenamiento. Representa la informacin contenida en la BD. } En la Figura 1.1 se representan los niveles de abstraccin de la arquitectura ANSI.
} describe

Niveles de abstraccin de la arquitectura ANSI.

You might also like