      

Relación = tabla o archivo Tupla = registro, fila o renglón Atributo = campo o columna Clave = llave o código de identificación Clave Candidata = superclave mínima Clave Primaria = clave candidata elegida Clave Ajena = clave externa o clave foránea

¿Qué es normalización? Normalización es un proceso que clasifica relaciones, objetos, formas de relación y demás elementos en grupos, en base a las características que cada uno posee.

Normalización de bases de datos
El proceso de normalización de bases de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo entidadrelación al modelo relacional. Las bases de datos relacionales se normalizan para:
  

Evitar la redundancia de los datos. Evitar problemas de actualización de los datos en las tablas. Proteger la integridad de los datos.

El creador de estas 3 primeras formas normales (o reglas) fue Edgar F. Codd.1
Ejemplo: Digamos que queremos crear una tabla con la información de usuarios, y los datos a guardar son el nombre, la empresa, la dirección de la empresa y algun e-mail, o bien URL .

Primer nivel de Formalización/Normalización. (F/N) 1. Eliminar los grupos repetitivos de la tablas individuales. 2. Crear una tabla separada por cada grupo de datos relacionados. 3. Identificar cada grupo de datos relacionados con una clave primaria.

tenemos que duplicar el nombre de la empresa y del usuario.com abc..com ¿ Ves que estamos rompiendo la primera regla cuando repetimos los campos url1 y url2 ? ¿ Y que pasa con la tercera regla..com abc.Formalización CERO Usuarios Nombre Joe Jill empresa ABC XYZ direccion_empresa 1 Work Lane 1 Job Street url1 abc.com xyz. Hemos separado el campo url en otra tabla.com url2 xyz. la clave primaria ? La regla tres básicamente significa que tenemos que poner campo tipo contador autoincrementable para cada registro. Relacionar estas tablas mediante una clave externa.Cada vez que introducimos un nuevo registro en la tabla usuarios.com Hemos solucionado el problema de la limitación del campo url.com xyz. ¿ Qué pasaria si tuvieramos dos usuarios llamados Joe y queremos diferenciarlos. Segundo nivel de F/N 1. Una vez que aplicaramos el primer nivel de F/N nos encontrariamos con la siguiente tabla: Usuarios userId 1 1 2 2 nombre Joe Joe Jill Jill Empresa ABC ABC XYZ XYZ direccion_empresa 1 Work Lane 1 Work Lane 1 Job Street 1 Job Street url abc. De otra forma. sino que será muy facil que la BD se corrompa si escribimos mal alguno de los datos redundantes. Tambien vamos a usar nuestra clave primaria para relacionar estos campos: . Pero sin embargo vemos otros problemas. 2. No sólo nuestra BD crecerá muchísimo.. Crear tablas separadas para aquellos grupos de datos que se aplican a varios registros. de forma que podemos añadir más en el futuro si tener que duplicar los demás datos.com xyz.

com abc. n uestro nombre de empresa y su dirección no tienen nada que ver con el campo userId.com xyz. Así que tendrémos que aplicar el tercer nivel de F/N: tercer nivel de F/N. relUserId. ¿ Pero que ocurre cuando queremos añadir otro empleado a la empresa ABC ? ¿ o 200 empleados ? Ahora tenemos el nombre de la empresa y su dirección duplicandose.com Hemos creado tablas separadas y la clave primaria en la tabla usuarios. userId.com xyz.Usuarios userId 1 2 nombre Joe Jill empresa ABC XYZ direccion_empresa 1 Work Lane 1 Job Street Urls urlId 1 2 3 4 relUserId 1 1 2 2 url abc. otra situación que puede inducirnos a introducir errores en nuestros datos. asi que tienen que tener su propio empresaId: Usuarios userId 1 2 nombre Joe Jill relEmpresaId 1 2 . 1Eliminar aquellos campos que no dependan de la clave. esta relacionada ahora con la clave externa En la tabla urls. Esto esta mejor.

es ligeramente más compleja. veremos tres tipos de relaciones entre los datos: uno-a-uno.com Ahora tenemos la clave primaria emprId en la tabla empresas relacionada con la clave externa recEmpresaId en la tabla usuarios. ¿ Pero que pasa si en lugar de entrada libre de texto usáramos un menú desplegable con 20 o incluso más urls predefinidas ? Entonces tendríamos que llevar nuestro diseño de BD al siguiente nivel de F/N.¿ Ves duplicación de datos ? Esto es perfectamente aceptable si la entrada de datos de este campo es solicitada al usuario en nuestra apliación para que teclee libremente su url. Observa en nuestro ejemplo del Tercer Nivel de F/N que tenemos a un usuario relacionado con varias urls. Relaciones entre los Datos Antes de definir el cuarto nivel de F/N. Nuestras tablas permiten a un sólo usuario tener asociadas varias urls. vamos a cambiar la estructura para permitir que varios . La relación varios-con-varios. Para los propósitos de nuestra aplicación no sería útil la normalización. y cada vez que introducimos un registro en la tabla usuarios tambien introducimos una sola fila en la tabla urls. y podemos añadir 200 usuarios mientras que sólo tenemos que insertar el nombre 'ABC' una vez. y por lo tanto es sólo una coincidencia que Joe y Jill teclearon la misma url.com abc. la única clase de relación que necesitamos. Como dijímos.empresas emprId 1 2 empresa ABC XYZ direccion_empresa 1 Work Lane 1 Job Street urls urlId 1 2 3 4 RelUserId 1 1 2 2 url abc. Nuestras tablas de usuarios y urls pueden crecer todo lo que quieran sin duplicación ni corrupción de datos. la relación 'varios-con-varios'. y hasta que se nos presentó el dilema del Tercer Nivel de F/N. el cuarto.com xyz. Entonces tendríamos una relacion uno-a-uno: cada fila en la tabla usuarios tendría exactamente una fila correspondiente en la tabla urls. uno-con-varios y varios-con-varios. Por un momento imaginámos que ponemos el campo url en una tabla separada. el tipo de relación más común. Esta es una relación uno-convarios.com xyz. muchos desarrolladores lo pasan por alto porque depende mucho de un tipo muy específico de relación. sin embargo. Pero hechemos un vistazo a nuestro campo urls . la cual aún no hemos encontrado en nuestra aplicación. Ahora mira las tablas en el ejemplo del Segundo Nivel de F/N. Mira la tabla usuarios en el Primer Nivel de F/N del ejemplo de arriba.

com xyz. 1. las urls. Veamos como quedarían nuestras tablas antes de seguir con este planteamiento: usuarios userId 1 2 nombre Joe Jill relEmpresaId 1 2 empresas emprId 1 2 empresa ABC XYZ direccion_empresa 1 Work Lane 1 Job Street urlId 1 2 url abc. y entre ambos. Hemos sido capaces de remover la entradas duplicadas en la tabla urls creando la tabla url_relations. entidades independientes no pueden ser almacenadas en la misma tabla. supone Cuarto Nivel de F/N. . Ahora podemos expresar fielmente la relación que ambos Joe and Jill tienen entre cada uno de ellos. Así que veamos exáctamente que es lo que el Cuarto Nivel de F/N.usuarios esten relacionados con varias urls y así tendremos una relación varios-convarios. hemos creado una tabla que sólo tiene claves externas y primarias url_relations.com url_relations relationId 1 2 3 4 relatedUrlId 1 1 2 2 relatedUserId 1 2 1 2 Para disminuir la duplicación de los datos ( este proceso nos llevará al Cuarto Nivel de F/N). En las relaciones varios-con-varios.

Su principio sugiere: 1. url FROM usuarios. pero es de hecho algo esotérico y en la mayoria de los casos no es necesario para obtener la mejor funcionalidad de nuestra estructura de datos o aplicación. Hemos optimizado nuestra tabla urls eliminado duplicados y hemos puesto las relaciones en su propia tabla. Os voy a poner un ejemplo prático. Hay menos repetición de datos.userId = 1 AND urls. ahora podemos seleccionar todas las urls de Joe realizando la siguiente instrucción SQL: SELECT nombre. hariamos algo así: SELECT nombre. Es una buena práctica aplicar este regla.urlId = url_relations. pero a no ser que estes tratando con una extensa estructura de datos probablemente no la necesitarás. La tabla original debe ser reconstruida desde las tablas resultantes en las cuales a sido troceada.urlId = url_relations.relatedUserId AND urls. Una base de datos nomlalizada puede ocupar menos espacio en disco que una no nomlalizada. Los beneficios de aplicar esta regla aseguran que no has creado ninguna columna extraña en tus tablas y que la estructura de las tablas que has creado sea del tamaño justo que tiene que ser. urls. Pero es muy útil en ciertas situaciones.userId = url_relations.Ya que sólo se aplica a las relaciones varios-con-varios. urls. Otra ventaja de la nomlalización de su base de datos es el consumo de espacio. tal como esta.relatedUserId = 1 AND usuarios. url_relations WHERE url_relations. la mayoria de los desarrolladores pueden ignorar esta regla de forma correcta. Existe otro nivel de normalización que se aplica a veces. lo que tiene como consecuencia un mucho menor uso de espacio en disco . Grados de normalización Existen básicamente tres niveles de normalización: . url_relations WHERE usuarios.relatedUrlId Quinto Nivel de F/N. url FROM usuarios.relatedUrlId Y si queremos recorrer todas las urls de cada uno de los usuarios.

Ésta es una regla muy fácil de seguir. Ésta representa lo que la base de datos . Éstas se refieren principalmente a los productos. El campo ID_Producto es el candidato ideal. debe eliminar las columnas repetidas y crearles su propia tabla. Clientes ID Cliente Nombre Apellidos Nombre_Producto1 Costo_Producto1 Imagen_Producto1 Nombre_Producto2 Costo_Producto2 Imagen_Producto2 Fecha_Pedido Cantidad_Pedido Nombre Cia Envios La tabla tiene varias columnas repetidas. se ha establecido una relación uno a varios. Eliminación de datos repetidos en una base de datos Clientes Pedidos ID_Clientes Nombre_Productos Nombre Costo_Producto Apellidos Imagen_Producto Direccion Numero_Pedido Fecha_Pedido Cantidad_Pedido Clave_Cia_Envios Nombre_Ci_ Envios Ahora tiene dos tablas. . No hay forma de relacionar los datos de la tabla original con los de la nueva tabla. debe añadir un campo clave a la segunda tabla de forma que se establezca la relación.Primera Forma Normal La regla de la Primera Forma Normal establece que las columnas repetidas deben eliminarse y colocarse en tablas separadas. Primera Forma Normal Clientes Pedidos ID_Productos ID_Productos ID_Clientes Nombre_Productos Nombre Costo_Producto Apellidos Imagen_Producto Direccion Numero_Pedido Fecha_Pedido Cantidad_Pedido Clave_Cia_Envios Así. Para hacerlo. De acuerdo con la regla. Pero todavía hay un problema. Observe el esquema de la tabla Clientes de la base de datos. Añada a la tabla Productos una clave primaria que se llame ID_Producto y añada una clave a la tabla Clientes que la relacione con la tabla Productos.

Segunda Forma Normal La regla de la Segunda Forma Normal establece que todas las dependencias parciales se deben eliminar y separar dentro de sus propias tablas. pero para ilustrar la normalización. La mayoría de la gente está demasiado ocupada. se creaba una nueva columna para almacenar la información. Alcanzar este nivel de normalización permite que los datos se acomoden de una manera natural dentro de los límites esperados. El resto de la información podría residir en su propia tabla. Obviamente. Al haber alcanzado la Segunda Forma Normal. No es necesario mencionar que un mejor entendimiento del funcionamiento de su base de datos conducirá aun mejor aprovechamiento de sus activos. y emplear tiempo para asegurarse de que sus datos están normalizados cuando todo funciona más o menos bien. crearán columnas que representen los mismos datos. Tendría que hacer algunos cambios en sus reglas del negocio para que esto fuera aplicable. Una depen dencia parcial es un término que describe a aquellos datos que no dependen de la clave de la tabla para identificarlos. . El cliente tendrá muchos productos que podrá comprar. resultaba una pesadilla para sus programadores/administradores. el diseño de la base de datos era bastante pobre y. En una empresa de servicios de electricidad. En lugar de tener que entender una tabla gigantesca y monolítica que tiene muchos diferentes aspectos. tenía una columna repetida más de treinta veces. La tabla de su base de datos. Sería mucho más simple utilizar únicamente el número del pedido. Lo mismo aplica para las otras tablas. el cliente necesitará haber pedido un producto para ser un cliente. Pero no es así. Por ejemplo. por lo mismo. usted puede disfrutar de algunas de las ventajas de las bases de datos relacionales. Usted tendrá que emplear más tiempo arreglando una base de datos no normalizada que el que emplearía en una normalizada. la información de pedidos está en cada uno de los registros. Poner la base de datos en la Primera Forma Normal resuelve el problema de los encabezados de columna múltiples. Eliminación de las dependencias parciales -Segunda Forma Normal Clientes Pedidos Productos ID_Productos ID_Productos ID_Producto ID_Clientes Nombre_Productos Fecha_Compra Nombre Cantidad_Pedido Costos_Productos Apellidos Imagen_Producto Direccion Numero_Pedido Nombre_Cia_Envios De nuevo. la cual contenía los números de parte de las refacciones. Muy a menudo. Una de las mayores desventajas de la normalización es el tiempo que lleva hacerlo. Usted ya no está obligado a añadir un cliente cada vez que añade un nuevo producto a su inventario. Además. usted sólo tiene que entender objetos pequeños y más tangibles. así está bien.estará haciendo en la vida real. sin importar cuántos otros clientes quieran comprarlos también. La normalización ayuda a clarificar la base de datos ya organizarla en partes más pequeñas y más fáciles de entender. así como las relaciones que guardan con otros objetos también pequeños. Una y otra vez. Cada vez que una nueva parte se tenía que dar de alta. Una vez que haya organizado la información de pedidos. había una base de datos para el control de refacciones de una planta nuclear. al organizar el esquema de esta forma puede reflejar el mundo real en su base de datos. parece ser un desperdicio de tiempo. puede añadir nuevas columnas a la tabla Clientes sin afectar a las tablas Productos y Pedidos. En la base de datos de muestra. los diseñadores de bases de datos inexpertos harán algo similar a la tabla no normalizada.

El esquema de la tabla podría verse como se muestra a continuación: ID_Cliente Nombre Apellidos Direccion1 Direccion2 De acuerdo con las reglas. Numero_Pedido Costos_Productos Cantidad_Pedidos Fecha_Pedido ID_Cia_Envios Foto_Producto Cantidad_Pedido Nombre Apellidos Direccion Ahora todas sus tablas están en la Tercera Forma Normal. El siguiente nivel de normalización explicará cómo solucionar esto. Puede insertar un registro sin un exceso de datos en la mayoría de las tablas. la cual no se identifica únicamente por la clave. A veces puede ocurrir que normalizar sus datos hasta el nivel más alto no tenga sentido. En la base de datos de muestra. Podría separar estos datos de la tabla y ponerlos en una tabla aparte. Todos los valores deben identificarse únicamente por la clave. Es muy normal tener dos líneas para la dirección.Una vez que ha alcanzado el nivel de la Segunda Forma Normal. Por ejemplo. Ésta no es dependiente del cliente. así como flexibles y eficientes. Las reglas de normalización existen como guías para crear tablas que sean fáciles de manejar. Tercera Forma Normal La regla de la Tercera Forma Normal señala que hay que eliminar y separar cualquier dato que no sea clave. y no hay datos repetidos. se han controlado la mayoría de los problemas de lógica. Esto provee un esquema limpio y elegante. Determinar las necesidades de simplificación depende de usted. Si su base de datos va a proveer información aun solo usuario para un propósito simple y existen pocas posibilidades de expansión. Qué tan lejos debe llevar la normalización La siguiente decisión es ¿qué tan lejos debe llevar la normalización? La normalización es una ciencia subjetiva. normalizar sus datos hasta la 3FN sea quizá algo extremoso. El resultado de este esquema se muestra a continuación: ID_Ciente ID_Direccion Nombre ID_Cliente Apellidos Direccion . la columna de dirección debería sacarse de esta tabla y reemplazarse con la clave de una nueva tabla. Eliminación de los datos que no son claves para la Tercera Forma Normal Clientes Productos PedidoMaestro PedidoDetallado Cias_Envios ID_cliente ID_Producto ID_Pedido ID_PedidoDetallado ID_Cia_Envios ID_Producto Nombre_Producto Fecha_Pedido ID_Pedido Nombre_Cia_Envios. Observando un poco más de cerca la tabla Clientes. que es fácil de trabajar y expandir. Cada columna en la tabla está identificada de manera única por la clave. Esto le da más flexibilidad y previene errores de lógica cuando inserta o borra registros. la tabla Clientes contiene la columna Nombre_Cia_Envios. suponga que añade una columna extra para la dirección en su base de datos. El valor de esta columna debe depender de la clave. si aplica la Primera Forma Normal. vemos la columna Nombre_Cia_Envios.

Ayuda a prevenir errores lógicos en la manipulación de datos. Cada nuevo nivel o forma lo acerca más a hacer su base de datos verdaderamente relacional. BOYCE/CODD NORMAL FORM: Es una extensión de la definición original de la 3FN. ¿Está dividiendo tablas sólo para seguir las reglas o estas divisiones son en verdad prácticas? Éstas son el tipo de cosas que usted. cada estudiante de esa materia puede tomar clases de solamente un maestro Cada maestro enseña una sola materia .La base de datos ahora cumple con la Primera Forma Normal. Quinta Forma Normal (5NF) o Forma Normal de Proyección-Unión. Un número grande de tablas pudiera indicar que está normalizando demasiado. En esta instancia. un nivel más de complejidad. Está ahí sólo para colectar información que pudiera utilizarse como información de contacto. Cuarta Forma Normal. el diseñador de la base de datos. Forma Normal de Proyección-Unión Extra Fuerte y Forma Normal de Clave de Dominio. Observe su esquema. Tienen que ver principalmente con dependencias múltiples y claves relacionales. La normalización facilita también agregar nuevas columnas sin romper el esquema actual ni las relaciones. necesita decidir. Es subjetiva. por tratar de seguir las reglas de normalización. La normalización no es una ciencia exacta. Una buena forma de determinar si está llevando demasiado lejos su normalización. es ver el número de tablas que tiene. Forma Normal de Proyección-Unión Fuerte. la segunda dirección es totalmente opcional. Segunda Forma Normal. Se discutieron las primeras tres formas. El problema aquí es que usted ha complicado demasiado una idea simple. Existen varios niveles de normalización: Primera Forma Normal. Un balance apropiado de sentido común y práctico puede ayudarle a decidir cuándo normalizar. En resumen La normalización es una técnica que se utiliza para crear relaciones lógicas apropiadas entre tablas de una base de datos. Forma Normal de Proyección-Unión Extra Fuerte y Forma Normal de Clave de Dominio. En el ejemplo mostrado. el exceso de normalización frustra el propósito para el que se utilizan los datos. Tercera Forma Normal. 3. Cuarta Forma Normal (4NF). La experiencia y el sentido común lo pueden auxiliar para tomar la decisión correcta. Éstas existen para hacer una base de datos realmente relacional. y tienen al menos un atributo en común( overlapped) Por cada materia. Forma Normal Boyce-Codd. No hay necesidad de partir la tabla en dos y forzar las reglas de la normalización. Ellos son Forma Normal Boyce-Codd. de manera innecesaria. Normalizar demasiado puede conducir a tener una base de datos ineficiente y hacer a su esquema demasiado complejo para trabajar. Forma Normal de Proyección-Unión Fuerte. Éstas proveen suficiente nivel de normalización para cumplir con las necesidades de la mayoría de las bases de datos. Estas formas de normalización pueden llevar las cosas más allá de lo que necesita. 2. la cual tiene problemas cuando 1. existen varias claves candidatas. Añade. Quinta Forma Normal o Forma Normal de Proyección-Unión. donde dichas claves son compuestas. Existen seis niveles más de normalización que no se han discutido aquí. Los clientes pueden tener más de una dirección.

Todo atributo en una tabla tiene un dominio. . Nombre. el cual representa el conjunto de valores que el mismo puede tomar. Salario).Cada materia es enseñada por varios maestros ///****************/////////////////////////////////////*******************************************************///////////// • Imagen • Historial del archivo • Enlaces a la imagen : Trabajo (Código. fila o renglón Atributo = campo o columna Clave = llave o código de identificación Clave Candidata = superclave mínima Clave Primaria = clave candidata elegida Clave Ajena = clave externa o clave foránea Clave Alternativa = clave secundaria Dependencia Multivaluada = dependencia multivalor RDBMS = Del inglés Relational Data Base Manager System que significa. Primera Forma Normal o 1NF del ingles First Normal Form. que constituyen la fuente teórica del modelo de base de datos relacional. Una instancia de una tabla puede verse entonces como un subconjunto del producto cartesiano entre los dominios de los atributos. Tupla y Atributo derivan de las matemáticas relacionales. Los términos Relación. Sistema Gestor de Bases de Datos Relacionales . donde Código es la Clave Primaria • • • • • • • • • • • Relación = tabla o archivo Tupla = registro. Sin embargo. Posición. 1FN = Significa.

una tupla puede razonarse matemáticamente como un elemento del producto cartesiano entre los dominios. Por ejemplo si conocemos el valor de FechaDeNacimiento podemos conocer el valor de Edad. Propiedades de la Dependencia funcional [editar] Existen 3 axiomas de Armstong: Dependencia funcional Reflexiva [editar] Si y esta incluido en x entonces Si la dirección o el nombre de una persona estan incluidos en el dni.dirección dni.suele haber algunas diferencias con la analogía matemática. Dependencia [editar] Dependencia funcional [editar] B es funcionalmente dependiente de A. entre otras cosas. De la normalización (lógica) a la implementación (física o real) puede ser sugerible tener éstas dependencias funcionales para lograr mayor eficiencia en las tablas. de la siguiente manera: FechaDeNacimiento Edad Aquí a FechaDeNacimiento se le conoce como un determinante. Se puede leer de dos formas FechaDeNacimiento determina a Edad o Edad es funcionalmente dependiente de FechaDeNacimiento.dirección . Finalmente. Las dependencias funcionales del sistema se escriben utilizando una flecha. entonces con el dni podemos determinar la dirección o su nombre. dado que algunos RDBMS permiten filas duplicadas. Dependencia funcional Aumentativa [editar] entonces dni nombre nombre. Una dependencia funcional es una conexión entre uno o más atributos.

La clave primaria es un identificador que va a ser único para cada fila. . por eso se utiliza este ejemplo). FechaDeNacimiento Edad Conducir Edad FechaDeNacimiento Edad Conducir Entonces tenemos que FechaDeNacimiento determina a Edad y la Edad determina a Conducir. las demas claves son las claves candidatas.ademas es la posible clave primaria. Muchas veces la clave primaria es autonumérica. Se acostumbra poner la clave primaria como la primera columna de la tabla pero esto no tiene que ser necesario. si no es más una conveniencia.Si con el dni se determina el nombre de una persona. Propiedades deducidas [editar] Union [editar] y entonces Pseudo-transitiva [editar] y entonces Descomposición [editar] y z esta incluido en y entonces Claves [editar] Una clave primaria es aquella columna (pueden ser también dos columnas o más) que identifica únicamente a esa fila. entonces con el dni más la dirección también se determina el nombre o su dirección. En una tabla puede que tengamos más de una clave. Dependencia funcional transitiva [editar] Dependencia funcional transitiva. para una persona poder conducir un automovil la persona necesita ser mayor de X edad. en tal caso se puede escoger una para ser la clave primaria. indirectamente podemos saber a través de FechaDeNacimiento a Conducir (En muchos paises .

Una clave alternativa es aquella clave candidata que no ha sido seleccionada como clave primaria. mínimos. Los datos son atómicos. las primeras tres formas normales son suficientes para cubrir las necesidades de la mayoría de las bases de datos. En otras palabras podríamos decir que la segunda forma normal está basada en el concepto de dependencia completamente funcional. El creador de estas 3 primeras formas normales (o reglas) fue Edgar F. (X – {A}) -x-> Y. (Si a cada valor de X le pertenece un valor de Y. Una clave compuesta es una clave que está compuesta por más de una columna.PNUMBER} -> HOURS es completamente dependencia dado . La tabla contiene una clave primaria La tabla no contiene atributos nulos Una columna no puede tener múltiples valores.. Por ejemplo {SSN. es a su vez clave primaria en otra tabla. Una dependencia funcional X-> Y es una dependencia parcial si hay algunos atributos A Є X que pueden ser removidos de X y la dependencia todavía se mantiene. En general. esto es A Є X. pero que también puede identificar de forma unica a una fila dentro de una tabla... Una dependencia funcional X -> Y es completamente funcional si al eliminar los atributos A de X significa que la dependencia no es mantenida. (X – {A}) -> Y . Codd. Una relación está en 2FN si está en 1FN y si los atributos que no forman parte de ninguna clave dependen de forma completa de la clave principal. Formas Normales [editar] Las formas normales son aplicadas a las tablas de una base de datos. esto es que A Є X. entonces a cada valor de Y le pertenece un valor de X).1 Primera Forma Normal (1FN) [editar] Artículo principal: Primera forma normal Una tabla está en Primera Forma Normal sólo si • • • Todos los atributos son atómicos. Es decir que no existen dependencias parciales. Un atributo es atómico si los elementos del dominio son indivisibles. Segunda Forma Normal (2FN) [editar] Artículo principal: Segunda forma normal Dependencia Funcional. Decir que una base de datos está en la forma normal N es decir que todas sus tablas están en la forma normal N.Una clave foránea es aquella columna que existiendo como dependiente en una tabla.

. de la clave primaria. Un ejemplo de este concepto sería que.que ni SSN -> HOURS ni PNUMBER -> HOURS mantienen la dependencia. Una tabla que se encuentra en la 4FN se dice que esta en la 5FN si. y sólo si. donde se mantiene X->Z y Z->Y. atributo que determina completamente a otro. Decimos que la dependencia de DMGRSSN el atributo clave SSN es transitiva via DNUMBER porque las dependencias SSN->DNUMBER y DNUMBER>DMGRSSN son mantenidas. siendo X una super-clave que. es clave candidata. una dependencia funcional X->Y en un esquema de relación R es una dependencia transitiva si hay un conjunto de atributos Z que no es un subconjunto de alguna clave de R. Forma Normal de Boyce-Codd (FNBC) [editar] Artículo principal: Forma normal de Boyce-Codd La tabla se encuentra en BCNF si cada determinante. Por ejemplo. Cuarta Forma Normal (4FN) [editar] Artículo principal: Cuarta forma normal Una tabla se encuentra en 4FN si. Sin embargo {SSN. .PNUMBER} -> ENAME es parcialmente dependiente dado que SSN>ENAME mantiene la dependencia Tercera Forma Normal (3FN) [editar] Artículo principal: Tercera forma normal La tabla se encuentra en 3FN si es 2FN y cada atributo que no forma parte de ninguna clave. para cada una de sus dependencias múltiples no funcionales X->->Y. Quinta Forma Normal (5FN) [editar] Artículo principal: Quinta forma normal Una tabla se encuentra en 5FN si: • • La tabla esta en 4FN No existen relaciones de dependencias no triviales que no siguen los criterios de las claves. X es o una clave candidata o un conjunto de claves primarias. depende directamente y no transitivamente. cada relación de dependencia se encuentra definida por las claves candidatas. y DNUMBER no es un subconjunto de la clave de EMP_DEPT. Intuitivamente. y sólo si. la dependencia SSN->DMGRSSN es una dependencia transitiva en EMP_DEPT de la siguiente figura. podemos ver que la dependencia de DMGRSSN sobre DNUMBER es indeseable en EMP_DEPT dado que DNUMBER no es una clave de EMP_DEPT.

Regla No. nombres de columnas. Por esta razón la definición de claves primarias para todas las tablas es prácticamente obligatoria. SQL) para acceder a los datos y a los metadatos (regla 4) Regla No. Toda la información.La regla del acceso garantizado [editar] Cada ítem de datos debe ser lógicamente accesible al ejecutar una búsqueda que combine el nombre de la tabla. 1 . Esto significa que dado un nombre de tabla. esto es. Por tanto los metadatos (diccionario. Regla No. Un RDBMS (Sistema Gestor de Bases de Datos Relacionales) debe ser capaz de soportar el uso de valores nulos en el lugar de columnas cuyos valores sean desconocidos o inaplicables. dado el valor de la clave primaria. catálogo) se representan exactamente igual que los datos de usuario. nombres de vistas. en tablas y columnas.La regla de la descripción de la base de datos [editar] La descripción de la base de datos es almacenada de la misma manera que los datos ordinarios.La Regla de la información [editar] Toda la información en un RDBMS está explícitamente representada de una sola manera por valores en una tabla. y dado el nombre de la columna requerida. y debe ser accesible a los usuarios autorizados. Y puede usarse el mismo lenguaje (ej. 3 . Las tablas que contienen tal información constituyen el Diccionario de Datos. Esto significa que todo tiene que estar almacenado en las tablas. incluyendo nombres de tablas. 4 . 2 . Cualquier cosa que no exista en una tabla no existe del todo. deberá encontrarse uno y solamente un valor. Un sistema podrá considerarse "más relacional" cuanto más siga estas reglas. y el nombre de la columna. en la práctica algunas de ellas son difíciles de realizar. Regla No. . entonces éste publicó 12 reglas que un verdadero sistema relacional debería tener. y los datos de las columnas deben estar almacenados en tablas dentro de las bases de datos. pero lo único que hacían era guardar la información en las tablas.Tratamiento sistemático de los valores nulos [editar] La información inaplicable o faltante puede ser representada a través de valores nulos. su clave primaria.Reglas de Codd [editar] Codd se percató de que existían bases de datos en el mercado las cuales decían ser relacionales. sin estar estas tablas literalmente normalizadas. Toda la información en una base de datos relacional se representa explícitamente en el nivel lógico exactamente de una manera: con valores en tablas.

restricciones de integridad. etc.La regla de independencia física [editar] El acceso de usuarios a la base de datos a través de terminales o programas de aplicación. debe permanecer consistente lógicamente cuando quiera que haya cambios en los datos almacenados. debe ser almacenada exactamente de la misma manera: En tablas. manipulación de datos. y éste comportamiento debería permanecer inalterado. Regla No. DELETE e INSERT deben estar disponibles y operables sobre los registros. El comportamiento de los programas de aplicación y de la actividad de usuarios vía terminales debería ser predecible basados en la definición lógica de la base de datos. Regla No. independientemente de los cambios en la definición física de ésta. 7 . definición de vistas. pero deshabilitan los intentos de actualizar vistas complejas. Estas tablas deben ser accesibles igual que todas las tablas. Esto significa que debe haber por lo menos un lenguaje con una sintaxis bien definida que pueda ser usado para administrar completamente la base de datos.La regla de insertar y actualizar [editar] La capacidad de manejar una base de datos con operandos simples aplica no sólo para la recuperación o consulta de datos.La regla de la actualización de vistas [editar] Todas las vistas que son teóricamente actualizables. deben ser actualizables por el sistema mismo. Regla No. 5 . permisos de acceso de usuarios autorizados.La regla del sub-lenguaje Integral [editar] Debe haber al menos un lenguaje que sea integral para soportar la definición de datos. UPDATE. independientemente del tipo de relaciones y restricciones que haya entre las tablas. 9 . 6 . sino también para la inserción. .La regla de independencia lógica [editar] Los programas de aplicación y las actividades de acceso por terminal deben permanecer lógicamente inalteradas cuando quiera que se hagan cambios (según los permisos asignados) en las tablas de la base de datos. y control de autorizaciones y transacciones. actualización y borrado de datos'. La mayoría de las RDBMS permiten actualizar vistas simples. Regla No. Esto significa que las cláusulas SELECT.La información de tablas. Regla No. a través de sentencias de SQL. vistas. o sean cambiados los métodos de acceso a los datos. 8 .

Regla No.La regla de la independencia de la integridad [editar] Todas las restricciones de integridad deben ser definibles en los datos.F. Vol. .J. Para cada valor de clave foránea deberá existir un valor de clave primaria concordante. "A Relational Model of Data for Large Shared Databanks".Date (1994). 13. lo que hace posible la subversión (violación) de las restricciones de integridad. y almacenables en el catalogo. No. por lo tanto los cambios en la estructura lógica no deben alterar o modificar estos programas de aplicación. 10 .La independencia lógica de los datos especifica que los programas de aplicación y las actividades de terminal deben ser independientes de la estructura lógica. Esto no debe ser permitido. AddisonWesley. Algunos productos solamente construyen una interfaz relacional para sus bases de datos No relacionales. (esta es la norma básica de integridad). Communications of the ACM. 11 . La combinación de estas reglas aseguran que haya Integridad referencial. ↑ A Relational Model of Data for Large Shared Data Banks Communications of the ACM. pueda funcionar como si estuviera disponible como en una única base de datos en una sola máquina. "An Introduction to Database Systems". Referencias [editar] 1. Las reglas de integridad [editar] 1.Regla de la no-subversión [editar] Si sistema tiene lenguajes de bajo nivel. pp. no en el programa de aplicación. estos lenguajes de ninguna manera pueden ser usados para violar la integridad de las reglas y restricciones expresadas en un lenguaje de alto nivel (como SQL).Codd (junio 1970). 377-387 [1] • • E. Regla No. 2.La regla de la distribución [editar] El sistema debe poseer un lenguaje de datos que pueda soportar que la base de datos esté distribuida físicamente en distintos lugares sin que esto afecte o altere a los programas de aplicación. El soporte para bases de datos distribuidas significa que una colección arbitraria de relaciones. 12 . June 1970. Ningún componente de una clave primaria puede tener valores en blanco o nulos. C. Regla No. bases de datos corriendo en una mezcla de distintas máquinas y distintos sistemas operativos y que esté conectada por una variedad de redes. 6.

Véase también [editar] • • • 1NF .6NF .DKNF . Obtenido de "http://es.5NF .org/wiki/Normalizaci %C3%B3n_de_bases_de_datos" . Normalización de bases de datos.Denormalización Edgar Frank Codd Base de datos Enlaces externos [editar] • • Bases de Datos: Formas Normales.BCNF .4NF .wikipedia.2NF . Optimizar Tablas.3NF .

Sign up to vote on this title
UsefulNot useful