Professional Documents
Culture Documents
Bases de Datos I
MTI Remedios Fabián Velasco
Ver. 1.1
Cuarto Semestre
Licenciatura en Informática
Temario
5 Diseño de bases de datos relacionales.
5.1 Objetivos del diseño de bases de datos.
5.2 Dependencias funcionales.
5.3 Normalización.
5.3.1 Primera forma normal.
5.3.2 Segunda forma normal.
5.3.2.1 Dependencia funcional de los datos.
5.3.2.2 Dependencia funcional completa.
5.3.2.3 Dependencia transitiva.
5.3.3 Tercera forma normal.
5.3.3.1 Forma normal de Boyce-Codd.
5.3.3.2 Atributos multivaluados.
5.3.3.3 Dependencias multivaluadas.
5.3.4 Cuarta forma normal.
5.3.5 Quinta forma normal.
5.4 Enfoques alternativos al diseño de bases de datos.
Bases de Datos I
5.5 Modelado semántico.
Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
5.1 Objetivos del diseño de bases
de datos.
El objetivo principal es crear una
REPRESENTACION PRECISA de los DATOS, de las
RELACIONES entre los datos y de las
RESTRICCIONES aplicables a los datos que sean
pertinentes para la organización.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
5.2 Dependencias funcionales.
Dependencia funcional
Describe la relación existente entre atributos de una
relación R, B será funcionalmente dependiente de A (lo
que se denota A → B) si cada valor de A esta asociado con
exactamente un valor de B (A y B puede consistir casa uno
de ellos de uno o más atributos.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Determinante: Hace referencia al atributo o grupo de atributos en el
lado izquierdo de la flecha que describe una dependencia funcional.
A determina funcionalmente a B
B depende funcionalmente de A
A B
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Dependencia funcional completa: Indica que si A y B son atributos
de una relación, B depende funcionalmente de manera completa de A
si B depende funcionalmente de A pero no de ningún subconjunto
propio de A.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Dependencia transitiva: Una condición en la que A → B y
B → C, entonces C depende transitivamente de A a
través de B (supuesto que A no sea funcionalmente
dependiente de B o C).
Considere:
noPersonal → sNombre, puesto, salario, noSucursal. bDireccion
noSucursal→ bDireccion
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
5.3. Normalización
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Primera Forma Normal
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
UFN - 1FN
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Para transformar de UFN a 1FN tenemos
que identificar y eliminar los grupos
repetitivos dentro de la tabla.
Un atributo repetitivo es aquel, dentro de una tabla que
presente múltiples valores para un mismo valor de los
atributos designados como clave principal de esa tabla.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
UFN
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
1FN
noClie cNom noPropi pDireccion inicioRe finRent rent noPropie oNomb
nte bre edad nta a a tario re
CR76 John PG4 6 Lawrence St 1-Jul-03 31-Ago- 350 CO40 Tina
Kay Glasgow 04 Murphy
CR76 John PG16 5 Novar Dr. 1-Sep- 1-Sep- 450 CO93 Tony
Kay Glasgow 04 05 Shaw
CR56 Aline PG4 6 Lawrence St 1-Sep- 10-Jun- 350 C040 Tina
Stewa Glasgow 02 03 Murphy
rt
CR56 Aline PG36 2 Manor Rd. 10-Oct- 1-Dic- 375 CO93 Tony
Stewa Glasgow 03 04 Shaw
rt
CR56 Aline PG16 5 Novar Dr. 1-Nov- 10-Ago- 450 CO93 Tony
Stewa Glasgow 05 06 Shaw
rt
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
noClient cNombre Cliente Relaciones alternativas de la
e
CR76 John Kay Primera Forma Normal
CR56 Aline Stewart
PropietariosPropiedadesRentas
noClie cNomb noPropie pDireccion inicioRenta finRenta rent noPropiet oNombre
nte re dad a ario
CR76 John PG4 6 Lawrence St 1-Jul-03 31-Ago- 350 CO40 Tina
Kay Glasgow 04 Murphy
CR76 John PG16 5 Novar Dr. 1-Sep-04 1-Sep- 450 CO93 Tony
Kay Glasgow 05 Shaw
CR56 Aline PG4 6 Lawrence St 1-Sep-02 10-Jun- 350 C040 Tina
Stewa Glasgow 03 Murphy
rt
CR56 Aline PG36 2 Manor Rd. 10-Oct- 1-Dic-04 375 CO93 Tony
Stewa Glasgow 03 Shaw
rt
CR56 Aline PG16 5 Novar Dr. 1-Nov-05 10-Ago- 450 CO93 Tony
Stewa Glasgow 06 Shaw
rt
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Segunda forma normal.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
La segunda forma normal (2FN) se basa
en el concepto de dependencia
funcional completa
Se aplica a las relaciones con claves
compuestas.
2FN: Una relación que esta en primera
forma normal y en la que todo atributo
que no sea clave principal depende
funcionalmente de manera completa de
la clave principal.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
2FN Relaciones en segunda forma
normal derivadas de la
relación ClienteRenta
Renta
noClient noPropieda inicioRent finRenta
e d a noClient cNombre
CR76 PG4 1-Jul-03 31-Ago- e
04 CR76 John Kay
CR76 PG16 1-Sep-04 1-Sep-05
CR56 Aline
CR56 PG4 1-Sep-02 10-Jun-03 Stewart
CR56 PG36 10-Oct-03 1-Dic-04
Cliente
CR56 PG16 1-Nov-05 10-Ago-
06
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Concepto
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Las dependencias funcionales nos permiten
expresar las restricciones que no se pueden
expresar con las superclaves.
Las dependencias funcionales se utilizarán de
dos maneras:
Propiedades
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Relaciones en 3FN
noPropietar oNombre Un resumen de las relaciones
io
CO40 Tina 3NF derivadas de la relación
Murphy
CO93 Tony Shaw ClienteRenta
Propietarios
Propiedades
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Una relación esta en FNBC, si y sólo si
todo determinante es una clave
candidata.
Esquema-cliente = (nomCliente,
calleCliente, ciudadCliente)
nomCliente → calleCliente ciudadCliente
Esquema-sucursal = (nomSucursal,
activo, ciudadSucursal)
nomSucursal → activo ciudadSucursal
Esquema-info-préstamo = (nomSucursal,
nomCliente, noPrestamo, importe)
noPrestamo → importe nomSucursal
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Puede afirmarse que Esquema-cliente
está en FNBC. Obsérvese que una clave
candidata para el esquema es
nomCliente.
Las únicas dependencias funcionales no
triviales que se cumplen en Esquema-
cliente tienen a nombre-cliente a la
izquierda de la flecha.
Dado que nombre-cliente es una clave
candidata, las dependencias funcionales
con nomCliente en la parte izquierda no
violan la definición de FNBC.
Lo mismo sucede con Esquema-sucursal.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
El esquema Esquema-info-préstamo, sin
embargo, no está en FNBC. Obsérvese que
noPrestamo no es una superclave de Esquema-
infopréstamo, ya que puede que haya un par de
tuplas que representen a un solo préstamo
concedido a dos personas, por ejemplo,
(Centro, Sr. Pinilla, P-44, 1.000)
(Centro, Sra. Pinilla, P-44, 1.000)
Como no se ha relacionado ninguna
dependencia funcional que descarte el caso
anterior, noPrestamo no es una clave candidata.
Sin embargo, la dependencia funcional
noPrestamo → importe es de tipo no trivial.
Por lo tanto, Esquema-info-prestamo no
satisface la definición de FNBC.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Considérese la descomposición de
Esquemainfo-préstamo en dos esquemas:
Esquema-préstamo = (noPrestamo,
nomSucursal, importe)
Esquema-prestatario = (nomCliente,
noPrestamo)
Esta descomposición es una
descomposición de reunión sin pérdida.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Comparación entre FNBC y
3FN
3FN se sabe que siempre resulta posible
obtener un diseño en 3FN sin sacrificar la
reunión sin pérdida o la conservación de
las dependencias.
Sin embargo, hay inconvenientes en 3FN: si
no se eliminan todas las dependencias
transitivas de las relaciones de los
esquemas, puede que se tengan que
emplear valores nulos para representar
algunas de las relaciones significativas
posibles entre los datos, y está el problema
de repetición de la información.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
La posibilidad de violar las condiciones
FNBC puede aparecer cuando:
La relación contenga dos o más claves
candidatas compuestas.
Las claves candidatas se solapen, es decir,
tengan atributos en común.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Cuarta Forma Normal 4FN
Considérese el ejemplo bancario. Supóngase que,
en un diseño alternativo del esquema de la base
de datos, se tiene el esquema
Esquema-BC = (noPrestamo, nomCliente,
calleCliente, ciudadCliente)
No está en FNBC debido a la dependencia
funcional
nomCliente → calleCliente ciudadCliente
que se estableció anteriormente, y debido a que
nombre-cliente no es una clave de Esquema-BC.
Sin embargo, supóngase que el banco está
atrayendo a clientes ricos que tienen varios
domicilios (por ejemplo, una residencia de invierno
y otra de verano). Entonces ya no se deseará
hacer que se cumpla la dependencia funcional
nomCliente → calleCliente ciudadCliente.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Para tratar este problema hay que definir
una nueva forma de restricción,
denominada dependencia multivalorada.
Como se hizo para las dependencias
funcionales, se utilizarán las dependencias
multivaloradas para definir una forma
normal para los esquemas de relación.
Esta forma normal, denominada cuarta
forma normal (4FN), es más restrictiva
que FNBC. Se verá que cada esquema 4FN
se halla también en FNBC, pero que hay
esquemas FNBC que no se hallan en 4FN.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Dependencia Multivalorada
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
4NF
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Quinta Forma Normal 5FN
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
5FN
Una relación 5FN, es aquella que no tiene
dependencias de combinación.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
5.4 Enfoques alternativos al diseño
de bases de datos.
Metodología de Diseño:
Es un enfoque estructurado que utiliza
procedimientos, técnicas, herramientas
y ayudas para la generación de
documentación con el fin de facilitar el
proceso de diseño y servirle de soporte.
Diseño conceptual de la base de
datos:
El proceso de construcción de un modelo
de los datos utilizados en una
organización, independientemente de
todas las consideraciones físicas.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Diseño lógico de la base de datos:
El proceso de construir un modelo de los datos
utilizados en una organización basándose en un
modelo de datos específico, pero con
independencia del SMBD concreto que se vaya
a utilizar y a cualquier otra consideración física.
Diseño físico de la base de datos
El proceso de generar una descripción de la
implementación de la base de datos en
almacenamiento secundario; describe las
relaciones base, la organización de los archivos
y los índices utilizados para conseguir un
acceso eficiente a los datos; así como
cualesquiera restricciones de integridad
asociadas y medidas de seguridad utilizadas.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Factores críticos del diseño
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Combinar técnicas de conceptualización,
normalización y validación de transacciones en la
metodología del modelado de los datos.
Emplear diagramas para representar una parte
mayor posible de los modelos de datos.
Usar lenguaje de diseño de base de datos para
representar información semántica acerca de los
datos que no puedan representarse fácilmente en
un diagrama.
Construir diccionario de datos para complementar
diagramas
Estar dispuesto a repetir diversos pasos en
determinadas ocasiones.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Pasos
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Paso 2 Construir y validar el modelo lógico
de los datos
Determinar las relaciones para el modelo lógico
de los datos
Validar las relaciones mediante técnicas de
normalización
Validar las relaciones comprobando
transacciones de usuarios
Comprobar las restricciones de integridad
Repasar el modelo lógico de los datos con los
usuarios
Combinar los modelos lógicos en un modelo
global
Verificar las consideraciones de crecimiento
futuro.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Paso 3. Traducir el modelo lógico de los
datos al SMBD seleccionado
Diseñar relaciones base
Diseñar representación de datos variados
Diseñar restricciones generales
Paso 4. Diseñar la organización de los
archivos y de los índices
Estimar requisitos de espacio
Paso 5. Diseñar vistas de usuarios
Paso 6. Considerar mecanismos de
seguridad
Paso 7. Considerar control de redundancia
Paso 8. Monitorizar el sistema final
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
5.5 Modelado semántico.
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco
Bibliografía utilizada
Libros:
Fundamentos de Bases de Datos. Abraham
Silberschatz, Henry F. Korth, S. Sudarshan
Sistemas de Bases de Datos. Thomas Conolly y
Carolyn Begg
Bases de Datos I Universidad del Mar 07/2008 MTI Remedios Fabián Velasco