Professional Documents
Culture Documents
1- Conceptos teóricos
sobre Bases de Datos.
2- Diseño y modelización
de datos tomando como
base el modelo
Entidad/Relación
3- Generalidades de SQL
Server 2000
4- Lenguaje SQL a través
de la implementación del
mismo en SQL Server
2000 (Transact SQL)
5- Ejemplos de diseño
utilizando una
herramienta CASE: Power
Designor
El editor prohíbe cualquier tipo de fijación, reproducción, transformación, distribución, ya sea mediante venta
y/o alquiler y/o préstamo y/o cualquier otra forma de cesión de uso, y/o comunicación pública de la misma, total
o parcialmente, por cualquier sistema o en cualquier soporte, ya sea por fotocopia, medio mecánico o
electrónico, incluido el tratamiento informático de la misma, en cualquier lugar del universo.
El almacenamiento o archivo de esta obra en un ordenador diferente al inicial está expresamente prohibido, así
como cualquier otra forma de descarga (downloading), transmisión o puesta a disposición (aún en sistema
streaming).
La vulneración de cualesquiera de estos derechos podrá ser considerada como una actividad penal tipificada en
los artículos 270 y siguientes del Código Penal.
La protección de esta obra se extiende al universo, de acuerdo con las leyes y convenios internacionales.
Esta obra está destinada exclusivamente para el uso particular del usuario, quedando expresamente prohibido su
uso profesional en empresas, centros docentes o cualquier otro, incluyendo a sus empleados de cualquier tipo,
colaboradores y/o alumnos.
Si Vd. desea autorización para el uso profesional, puede obtenerla enviando un e-mail fmarin@eidos.es o al fax
(34)-91-5017824.
Si piensa o tiene alguna duda sobre la legalidad de la autorización de la obra, o que la misma ha llegado hasta
Vd. vulnerando lo anterior, le agradeceremos que nos lo comunique al e-mail fmarin@eidos.es o al fax (34)-91-
5012824). Esta comunicación será absolutamente confidencial.
Colabore contra el fraude. Si usted piensa que esta obra le ha sido de utilidad, pero no se han abonado los
derechos correspondientes, no podremos hacer más obras como ésta.
ISBN 84-88457-24-3
ÍNDICE................................................................................................................................................... 5
INTRODUCCIÓN ................................................................................................................................. 9
DEFINICIÓN DE BASE DE DATOS ........................................................................................................... 9
CONCEPTOS BÁSICOS ......................................................................................................................... 10
DEL ENFOQUE TRADICIONAL A LOS SISTEMAS DE BASES DE DATOS ................................................. 10
ARQUITECTURA ANSI/X3/SPARC ................................................................................................... 12
EL MODELO RELACIONAL .................................................................................................................. 12
VISIÓN GENERAL SOBRE EL DISEÑO DE BASES DE DATOS.............................................. 15
FASES DEL DISEÑO ............................................................................................................................. 15
DISEÑO CONCEPTUAL ........................................................................................................................ 17
DISEÑO LÓGICO.................................................................................................................................. 17
DISEÑO FÍSICO.................................................................................................................................... 21
DISEÑO CONCEPTUAL ................................................................................................................... 23
INTRODUCCIÓN .................................................................................................................................. 23
ETAPAS DEL DISEÑO CONCEPTUAL .................................................................................................... 24
EL MODELO ENTIDAD / RELACIÓN ..................................................................................................... 24
EJEMPLOS PRÁCTICOS DE DISEÑO CONCEPTUAL................................................................................ 29
DISEÑO LÓGICO............................................................................................................................... 35
INTRODUCCIÓN .................................................................................................................................. 35
PASO DEL ESQUEMA CONCEPTUAL AL ESQUEMA LÓGICO ESTÁNDAR ............................................... 36
ETAPAS EN EL DISEÑO LÓGICO........................................................................................................... 37
PARTICIONAMIENTO HORIZONTAL DE RELACIONES .......................................................................... 38
PARTICIONAMIENTO VERTICAL DE RELACIONES ............................................................................... 41
PARTICIONAMIENTO MIXTO ............................................................................................................... 44
TEORÍA DE LA NORMALIZACIÓN ........................................................................................................ 45
EJEMPLOS PRÁCTICOS DE NORMALIZACIÓN ...................................................................................... 49
PROCESO DE DESNORMALIZACIÓN .................................................................................................... 55
DISEÑO FÍSICO ................................................................................................................................. 57
INTRODUCCIÓN .................................................................................................................................. 57
ESTRATEGIAS EN EL DISEÑO FÍSICO ................................................................................................... 58
CONCEPTOS BÁSICOS SOBRE GESTIÓN DE FICHEROS ......................................................................... 58
ORGANIZACIÓN DE FICHEROS ............................................................................................................ 59
TÉCNICAS PARA EL AUMENTO DE EFICIENCIA ................................................................................... 59
INTRODUCCIÓN A SQL SERVER ................................................................................................. 63
¿QUÉ ES SQL SERVER?...................................................................................................................... 63
ORÍGENES........................................................................................................................................... 64
SQL SERVER E INTERNET .................................................................................................................. 64
LO NUEVO EN SQL-SERVER 2000 ................................................................................................ 65
INTRODUCCIÓN .................................................................................................................................. 65
NUEVAS CARACTERÍSTICAS ............................................................................................................... 65
SOPORTE PARA XML ......................................................................................................................... 66
PARTICIONAMIENTO HORIZONTAL DE RELACIONES Y GESTIÓN DE VISTAS DISTRIBUIDAS ............... 67
SOPORTE PARA VIRTUAL INTERFACE ARCHITECTURE (VIA) ........................................................... 67
FUNCIONES DE USUARIO .................................................................................................................... 67
INDEXACIÓN DE VISTAS ..................................................................................................................... 67
NUEVOS TIPOS DE DATOS ................................................................................................................... 67
NUEVOS TRIGGERS ............................................................................................................................. 68
REGLAS DE INTEGRIDAD REFERENCIAL EN CASCADA ....................................................................... 68
NUEVAS CARACTERÍSTICAS DE INDEXACIÓN .................................................................................... 68
SOPORTE PARA CONSULTAS DISTRIBUIDAS ....................................................................................... 68
CARACTERÍSTICAS DE SEGURIDAD Y CIFRADO DE DATOS ................................................................. 68
INSTALACIÓN DE SQL SERVER 2000 ......................................................................................... 69
EL MODELO E/R EN SQL-SERVER 2000 ..................................................................................... 75
INTRODUCCIÓN .................................................................................................................................. 75
CREAR UN NUEVO DIAGRAMA ........................................................................................................... 77
RESTRICCIONES E INTEGRIDAD REFERENCIAL ................................................................................... 79
MODIFICACIÓN DEL ESQUEMA ........................................................................................................... 81
CREAR UNA NUEVA RELACIÓN .......................................................................................................... 82
EL ANALIZADOR DE CONSULTAS.............................................................................................. 85
INTRODUCCIÓN .................................................................................................................................. 85
LAS OPCIONES DE MENÚ .................................................................................................................... 85
LA BARRA DE HERRAMIENTAS ........................................................................................................... 91
EJECUTANDO UNA CONSULTA ........................................................................................................... 92
EL LENGUAJE DE DEFINICIÓN DE DATOS (DDL) .................................................................. 97
INTRODUCCIÓN .................................................................................................................................. 97
TIPOS DE DATOS ................................................................................................................................. 97
CREACIÓN DE TABLAS ....................................................................................................................... 99
MODIFICACIÓN DE TABLAS .............................................................................................................. 100
BORRADO DE TABLAS ...................................................................................................................... 101
CREACIÓN Y BORRADO DE ÍNDICES ................................................................................................. 101
EJEMPLOS PRÁCTICOS DE USO DEL DDL............................................................................. 103
INTRODUCCIÓN ................................................................................................................................ 103
LA SENTENCIA CREATE TABLE ................................................................................................... 103
LA SENTENCIA ALTER TABLE ...................................................................................................... 107
LA SENTENCIA DROP TABLE ........................................................................................................ 111
LA SENTENCIA CREATE INDEX.................................................................................................... 112
LA SENTENCIA DROP INDEX......................................................................................................... 112
EL LENGUAJE DE MANIPULACIÓN DE DATOS (DML) ....................................................... 115
INTRODUCCIÓN ................................................................................................................................ 115
LA SENTENCIA SELECT .................................................................................................................... 115
LA CLÁUSULA WHERE ..................................................................................................................... 117
LA CLÁUSULA GROUP BY ................................................................................................................ 118
LA CLÁUSULA HAVING .................................................................................................................... 119
LA CLÁUSULA ORDER BY ................................................................................................................ 119
FUNCIONES ESCALARES PARA SELECT ............................................................................................ 119
LA SENTENCIA INSERT ..................................................................................................................... 122
LA SENTENCIA UPDATE ................................................................................................................... 123
LA SENTENCIA DELETE .................................................................................................................... 123
OPERADORES BÁSICOS Y CONSIDERACIONES DEL LENGUAJE ................................... 125
INTRODUCCIÓN ................................................................................................................................ 125
OPERADOR PROYECCIÓN ................................................................................................................. 125
OPERADOR UNION ........................................................................................................................... 127
OPERADOR JOIN ............................................................................................................................... 128
OPERADORES PROPIOS DE TRANSACT SQL ..................................................................................... 132
VARIABLES GLOBALES..................................................................................................................... 135
SENTENCIAS CONDICIONALES.......................................................................................................... 137
SENTENCIAS ITERATIVAS ................................................................................................................. 138
LA SENTENCIA INSERT................................................................................................................ 139
INTRODUCCIÓN ................................................................................................................................ 139
SINTAXIS .......................................................................................................................................... 139
EJEMPLOS......................................................................................................................................... 140
CARGA DE LA BASE DE DATOS DE EJEMPLO ..................................................................................... 143
LA SENTENCIA SELECT............................................................................................................... 147
INTRODUCCIÓN ................................................................................................................................ 147
LA CLAÚSULA WHERE ................................................................................................................... 148
EL OPERADOR JOIN .......................................................................................................................... 149
LAS FUNCIONES DE AGREGADO ....................................................................................................... 151
LA CLAÚSULA GROUP BY ............................................................................................................. 154
LA SENTENCIA UPDATE .............................................................................................................. 157
INTRODUCCIÓN ................................................................................................................................ 157
EJEMPLOS......................................................................................................................................... 157
LA SENTENCIA DELETE .............................................................................................................. 163
INTRODUCCIÓN ................................................................................................................................ 163
LA INTEGRIDAD REFERENCIAL......................................................................................................... 164
LA SENTENCIA TRUNCATE TABLE.............................................................................................. 165
EJEMPLOS......................................................................................................................................... 166
PROCEDIMIENTOS ALMACENADOS Y TRIGGERS ............................................................. 169
INTRODUCCIÓN ................................................................................................................................ 169
7
PARÁMETROS POR REFERENCIA ....................................................................................................... 170
PROCEDIMIENTOS ALMACENADOS DE SISTEMA............................................................................... 172
EXTENDED STORED PROCEDURES .................................................................................................... 173
TRIGGERS ......................................................................................................................................... 174
EJEMPLOS PRÁCTICOS DE USO DE PROCEDIMIENTOS ALMACENADOS .................. 177
INTRODUCCIÓN ................................................................................................................................ 177
LA SENTENCIA IF ... ELSE............................................................................................................... 177
LA SENTENCIA CASE ...................................................................................................................... 179
EJECUCIÓN DINÁMICA DE SENTENCIAS: LA INSTRUCCIÓN EXEC ................................................... 180
CONVERSIÓN DE TIPOS..................................................................................................................... 181
LA SENTENCIA WHILE.................................................................................................................... 182
TRIGGERS EN SQL-SERVER 2000 .............................................................................................. 183
INTRODUCCIÓN ................................................................................................................................ 183
LAS TABLAS DELETED E INSERTED .................................................................................................. 184
TIPOS DE DESENCADENADORES ....................................................................................................... 184
LIMITACIONES DE LOS TRIGGERS ..................................................................................................... 184
RESOLUCIÓN DIFERIDA DE NOMBRES .............................................................................................. 185
EJEMPLOS......................................................................................................................................... 185
SEGURIDAD ..................................................................................................................................... 189
INTRODUCCIÓN ................................................................................................................................ 189
CONCESIÓN DE PRIVILEGIOS ............................................................................................................ 189
REVOCACIÓN DE PRIVILEGIOS ......................................................................................................... 191
DENEGACIÓN DE PERMISOS ............................................................................................................. 193
MANTENIMIENTO DE VISTAS ........................................................................................................... 193
RECOMENDACIONES ........................................................................................................................ 194
EJEMPLO PRÁCTICO DE IMPLEMENTACIÓN...................................................................... 195
INTRODUCCIÓN ................................................................................................................................ 195
LENGUAJE DE DEFINICIÓN DE DATOS............................................................................................... 196
LENGUAJE DE MANIPULACIÓN DE DATOS ........................................................................................ 198
PRESENTE Y FUTURO DE LAS BASES DE DATOS ................................................................ 203
DISEÑO CONCEPTUAL CON POWER DESIGNOR................................................................. 207
INTRODUCCIÓN ................................................................................................................................ 207
CREACIÓN DE UNA ENTIDAD ............................................................................................................ 208
CREACIÓN DE RELACIONES .............................................................................................................. 213
LA RELACIÓN DE HERENCIA............................................................................................................. 215
DISEÑO FÍSICO CON POWER DESIGNOR ............................................................................... 217
PASO DEL ESQUEMA CONCEPTUAL AL ESQUEMA FÍSICO ................................................................. 217
MODIFICACIÓN DE LAS TABLAS ....................................................................................................... 218
COLUMNAS ...................................................................................................................................... 219
INDICES ............................................................................................................................................ 219
ATRIBUTOS EXTENDIDOS ................................................................................................................. 221
TRIGGERS ......................................................................................................................................... 221
RESTRICCIONES................................................................................................................................ 222
CREACIÓN DE VISTAS ....................................................................................................................... 222
EJEMPLO DE DISEÑO CON POWER DESIGNOR................................................................... 225
Introducción
• "Colección o depósito de datos, donde los datos están lógicamente relacionados entre sí,
tienen una definición y descripción comunes y están estructurados de una forma particular.
Una base de datos es también un modelo del mundo real y, como tal, debe poder servir para
toda una gama de usos y aplicaciones". (Conference des Statisticiens Européens, 1977).
• "Conjunto estructurado de datos registrados sobre soportes accesibles por ordenador para
satisfacer simultáneamente a varios usuarios de forma selectiva y en tiempo oportuno".
(Delobel, 1982).
Como se ha visto, el concepto de base de datos ha ido cambiando a lo largo del tiempo. En la
actualidad podemos establecer la definición de base de datos como sigue.
"Colección o depósito de datos integrados, almacenados en soporte secundario (no volátil) y con
redundancia controlada. Los datos, que han de ser compartidos por diferentes usuarios y aplicaciones,
deben mantenerse independientes de ellos, y su definición (estructura de la base de datos) única y
almacenada junto con los datos, se ha de apoyar en un modelo de datos, el cual ha de permitir captar
las interrelaciones y restricciones existentes en el mundo real. Los procedimientos de actualización y
recuperación, comunes y bien determinados, facilitarán la seguridad del conjunto de los datos".
Conceptos básicos
• Sistema de Gestión de Base de Datos (SGBD): Conjunto de programas que permiten la
implantación, acceso y mantenimiento de la base de datos. El SGBD, junto con la base de
datos y con los usuarios, constituyen el Sistema de Base de Datos.
10
© Grupo EIDOS 1. Introducción.
• Si en este momento se quiere añadir en número de fax, se hace necesario una completa
reestructuración de dicho fichero, sin mencionar el rediseño del código de la aplicación, para
dar cabida a este cambio.
En cambio, en un sistema de gestión de bases de datos, estos problemas no tienen cabida, ya que el
control de la información es inherente al propio sistema.
Algunas de las ventajas que ofrece utilizar un Sistema de Bases de Datos son las siguientes:
2. Coherencia de resultados: Debido a que los datos son almacenados una sola vez, se evitan los
problemas que puede ocasionar la redundancia. Más adelante veremos cómo se permite una
cierta duplicidad de datos, con el fin de conseguir una mayor eficiencia, controlada por el
sistema y que no afecta a la redundancia lógica.
3. Mejor disponibilidad de datos para los usuarios: Los datos son compartidos por un conjunto de
usuarios, que accede a ellos de forma concurrente, siempre que estén autorizados a ello.
A pesar de todas estas ventajas, los Sistemas de Bases Datos no están exentos de inconvenientes. Aquí
se detallan los más importantes:
3. Falta de rentabilidad a corto plazo: Los amplios costes que conlleva la implantación, implica
una rentabilidad no a corto, sino a medio, o incluso largo plazo.
4. Escasa estandarización: Esto supone una dificultad añadida a los usuarios de la base de datos.
5. Desfase entre teoría y práctica: Los constantes avances teóricos en al ámbito de las bases de
datos, que muchas veces no se ven traducidos en la práctica, hacen llevarse a engaño a muchos
usuarios, creyendo que constituyen ya una realidad, cuando no han sido todavía plasmados.
11
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Arquitectura ANSI/X3/SPARC
ANSI/X3/SPARC es un grupo de estudio del Standard Planning and Requirements Commitee
(SPARC) del ANSI (American National Standars Institute), dentro del Comité X3 que se ocupa de
ordenadores e informática. En sus estudios acerca de los SGBD, propugnaron una arquitectura basada
en tres niveles de abstracción:
1. Nivel Externo: Es el nivel más cercano a los usuarios, y en el se definen los datos tal y como
los va a ver este. Cada usuario puede tener su propio modelo externo, con aquellos datos e
interrelaciones que dicho usuario necesite. En este nivel, también deberán definirse las
restricciones de uso, como por ejemplo el derecho a insertar o borrar determinados datos, o
poder acceder a ellos.
3. Nivel Interno: Nivel más bajo en la abstracción. Describe la estructura almacenamiento físico
de los datos, las estrategias de acceso a los datos, etc. Así mismo especifica todos los aspectos
relacionados con el hardware, como por ejemplo dispositivos de memoria a usar (tamaño de
páginas, número de éstas, tamaño de los buffers, etc.), técnicas de compresión de datos,
criptografiado, etc. El modelo interno, que es único, corresponde a la implementación del
modelo conceptual.
El modelo relacional
El modelo más usado, y por lo tanto el que se estudiará en este curso, es el modelo relacional. El
motivo de que sea éste el modelo más extendido, radica en la facilidad y en su amplia base
matemática, lo que permitirá, como ya se verá más adelante, el poder estructurar o reestructurar las
relaciones, para evitar cierto tipo de anomalías, o acelerar las consultas / actualizaciones. Dicho
modelo se basa en la representación de la información por medio de estructuras tipo tabla,
denominadas relaciones, y que almacenan información para una determinada entidad. Cada una de
estas relaciones representa en sus columnas los valores significativos, es decir, de los que interesa
conocer su valor, para cada entidad. Dichas columnas se denominan atributos, y para cada uno de ellos
existirá un valor (cabe la posibilidad de que existan atributos en los que no aparezca ningún valor).
Cada fila representa la información para cada ocurrencia de una determinada entidad. La información
se descompondrá, como ya se ha dicho, en dar valores para cada uno de los atributos de la entidad. A
dichas filas también se las denomina tuplas. Cada atributo o conjunto de atributos que identifica
unívocamente a cada tupla de la relación se denomina clave. Las claves se representan subrayando el /
los atributo/s que forman parte de ella.
El siguiente ejemplo (Figura 1) representa una relación denominada empleado, que almacena
información sobre los empleados de una empresa. La información que se desea saber de cada
empleado es su código, su nombre y apellidos, su sueldo y su categoría. Por lo tanto, los atributos son
cod_empleado, nombre, apellidos, sueldo y categoría. Además, el atributo cod_empleado es clave de
la relación, ya que si se sabe el valor de dicho atributo, se puede saber a que empleado nos estamos
refiriendo.
12
© Grupo EIDOS 1. Introducción.
Figura 1
13
Visión general sobre el diseño de bases
de datos
El diseño lógico parte del esquema conceptual y genera el esquema lógico. Un esquema lógico es la
descripción de la estructura de la base de datos que puede procesarse por un SGBD. Una vez elegido
el modelo lógico, pueden existir un conjunto de esquemas lógicos equivalentes al mismo esquema
conceptual. La meta del diseño lógico es producir el esquema lógico más eficiente con respecto a las
operaciones de consulta y actualización.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
El diseño físico toma como punto de partida el esquema lógico y como resultado produce el esquema
físico. Un esquema físico es una descripción de la implementación de la base de datos en memoria
secundaria; describe las estructuras de almacenamiento y los métodos de acceso para acceder a los
datos de una manera eficiente. Por ello, el diseño físico se genera para un SGBD y un entorno físico
determinado.
En la Figura 2 se resumen las tres grandes fases del diseño de una base de datos: primero se diseña el
esquema conceptual (que se realiza con un modelo conceptual de datos), esquema que proporciona
una descripción estable de la base de datos (independiente del SGBD) que se vaya a utilizar;
posteriormente se pasa del esquema conceptual al modelo de datos propio de SGBD elegido (diseño
lógico); por último se eligen las estructuras de almacenamiento, los caminos de acceso (índices), y
todos los aspectos relacionados con el diseño físico.
16
© Grupo EIDOS 2. Visión general sobre el diseño de bases de datos.
La Figura 3 muestra la correspondencia existente entre las fases de diseño y los niveles de la
arquitectura ANSI/X3/SPARC. El diseño conceptual es una etapa previa al diseño lógico. A su vez, el
diseño lógico se corresponde con los niveles externo (donde se definen las vistas de usuario, es decir,
conjunto de información que puede ser accedida por un usuario) y lógico (estructura de tablas y
restricciones) de la arquitectura ANSI/X3/SPARC. El diseño físico se corresponde con el nivel físico
de dicha arquitectura.
Diseño conceptual
El objetivo del diseño conceptual, también denominado modelo conceptual, y que constituye la
primera fase de diseño, es obtener una buena representación de los recursos de información de la
empresa, con independencia de usuario o aplicaciones en particular y fuera de consideraciones sobre
eficiencia del ordenador. Consta de dos fases:
Diseño lógico
El objetivo del diseño lógico es transformar el esquema conceptual obtenido en la fase anterior,
adaptándolo al modelo de datos en el que se apoya el SGBD que se va a utilizar.
El modelo relacional es el único modelo que ha permitido abordar la fase de diseño lógico aplicando
una teoría formal: el proceso de normalización.
Sin embargo, la normalización no cubre toda esta fase, mostrándose insuficiente para alcanzar todos
los objetivos de la misma. En la práctica a veces es preciso proceder a una reestructuración de las
relaciones.
La Figura 4, resume la fase de diseño lógico, en la que una vez estructurado el esquema origen,
analizando diferentes factores como las distintas dependencias o la posibilidad de existencia de valores
nulos, se obtiene un esquema relacional, al que se añaden las claves ajenas y otras restricciones de
integridad. Ahora bien, si se tiene en cuenta el segundo de los objetivos mencionados anteriormente, el
de que la base de datos ha de ser un servidor operacional y eficiente de los datos, se hace necesaria una
reestructuración de relaciones, con el fin de mejorar la eficiencia de la base de datos.
Esta reestructuración toma como entrada el esquema relacional estructurado obtenido anteriormente,
así como el análisis de los requisitos de determinadas vistas o aplicaciones críticas, obteniendo de esta
manera un esquema relacional resultante, en el que priman las consideraciones de eficiencia.
En la Figura 4, se detallan las dos etapas en las que se divide la fase de diseño lógico. La primera,
consistente en la estructuración de las relaciones atendiendo a consideraciones de tipo lógico, incluye
17
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
la normalización, así como el particionamiento horizontal de las mismas cuando sea necesario,
mientras que en la segunda se reestructuran las relaciones teniendo en cuenta consideraciones de tipo
físico que pueden llevar a la desnormalización, o al particionamiento horizontal, vertical o mixto. La
razón de esta etapa de reestructuración se encuentra en la falta de flexibilidad de la estructura interna
de los actuales SGBD, los cuales no ofrecen los adecuados instrumentos de diseño físico, obligando a
trasladar a la fase de diseño lógico consideraciones de eficiencia que deberían ser ajenas a dicha fase.
En esta etapa de estructuración se conseguirá, por razones lógicas, un esquema normalizado, en el cual
se han eliminado los valores nulos (inaplicables) mediante un particionamiento horizontal basado en la
selección, seguido de la proyección.
18
© Grupo EIDOS 2. Visión general sobre el diseño de bases de datos.
• El proceso de normalización
El particionamiento horizontal de relaciones, permite eliminar valores nulos inaplicables que pueden
aparecer en las relaciones mediante un proceso de selección, seguido de proyecciones sobre las
relaciones resultantes. El resultado de este particionamiento horizontal será la división de una relación
en la que existen o pueden existir valores nulos, en varias relaciones en las que los valores nulos
inaplicables no tienen cabida.
19
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
datos ha de ser un servidor operacional y eficiente de los datos, por lo que se hace necesaria esta
segunda etapa en el diseño lógico. Para lograr este objetivo existen diversos métodos o formas de
organizar los datos, considerando esta idea de mejora de la eficiencia, que son:
• El proceso de desnormalización
• El particionamiento de relaciones
El particionamiento de relaciones es otra forma de conseguir una mayor eficiencia en la base de datos.
El objetivo de este proceso es dada una relación, dividirla en otras relaciones de forma horizontal, o
vertical, o mixta (incluye ambas). A cada una de estas formas de particionamiento se la denomina,
respectivamente, particionamiento horizontal, particionamiento vertical y particionamiento mixto.
20
© Grupo EIDOS 2. Visión general sobre el diseño de bases de datos.
Diseño físico
El objetivo del diseño físico, que es la última fase del proceso de diseño, es conseguir una
instrumentación lo más eficiente posible del esquema lógico. Aquí se tienen en cuenta aspectos del
hardware, requisitos de procesos, características del SGBD, del SO y en general, cualquier factor
cercano a la "maquina". Con ello se persigue:
El principal problema que se plantea en la fase de diseño físico es el debido a la poca flexibilidad de
los actuales SGBD, los cuales obligan a trasladar a la fase de diseño lógico, aspectos de carácter físico,
que deberían ser ajenos a dicha fase. Esto obliga a iterar desde la fase de diseño físico a la de diseño
lógico, y viceversa, hasta obtener conseguir los objetivos anteriormente expuestos, lo que explica la
obligación de la etapa de reestructuración en el diseño lógico.
Como resultado del diseño físico se genera un esquema físico, que es una descripción de la
implementación de la base de datos en memoria secundaria; describe las estructuras de
almacenamiento y los métodos de acceso para acceder a los datos de una manera eficiente. Por ello el
diseño físico se genera para un SGBD y un entorno físico determinado.
21
Diseño conceptual
Introducción
Como ya se ha visto en el tema anterior, el diseño conceptual, que constituye la primera etapa en el
diseño de una base de datos, consiste en obtener una buena representación de los recursos de
información de la empresa, con independencia de usuario o aplicaciones en particular y fuera de
consideraciones sobre eficiencia del ordenador. Puesto que no se corresponde con ningún nivel de la
arquitectura ANSI/X3/SPARC, sino que es un paso previo, tiende a ser no tenido en cuenta a la hora
de proceder al diseño de una base de datos. Esto no es aconsejable, ya que el diseño lógico parte del
esquema conceptual y, si éste no es correcto, o no representa fielmente la información del mundo real,
el esquema de la base de datos no será estable, viéndonos obligados a reajustarlo constantemente
debido a las deficiencias arrastradas desde esta etapa de diseño. De ahí la importancia de realizar un
buen esquema conceptual, que represente fielmente las características del mundo real.
Otro error que se suele cometer en esta etapa de diseño es el de considerar aspectos tales como la
eficiencia del equipo hardware en el que se vaya a montar la base de datos, o SGBD's concretos. Como
ya se ha dicho, el esquema conceptual debe representar la información fuera de consideraciones sobre
hardware y sobre el SGBD sobre el que se implementará. Por lo tanto, se pueden establecer las
siguientes características que debe cumplir un buen esquema conceptual:
Conviene no olvidar, por lo tanto, que un buen diseño del esquema conceptual, influirá positivamente
en el resto de etapas.
Los objetivos que debe cumplir un esquema conceptual son los siguientes (Piattini y De Miguel):
24
© Grupo EIDOS 3. Diseño conceptual
1. Entidades: Una entidad es "una persona, lugar, cosa, concepto o suceso, real o abstracto,
de interés para la empresa" (ANSI 1977). En el modelo E/R, se representa por un
rectángulo, con el nombre de dicha entidad escrito en la parte superior. Por ejemplo, la
Figura 8 representa la entidad automóvil.
Figura 8
2. Atributos: Un atributo es cualquier característica que describe a una entidad. Los atributos
de una entidad se colocan dentro del rectángulo que representa dicha entidad, justo debajo
del nombre de ésta. Por ejemplo, se puede decir que un automóvil tiene las siguientes
características: nº de matricula, marca, modelo y color, lo cual se muestra en la Figura 9.
Figura 9
3. Clave: La clave de una entidad es un atributo o conjunto de atributos de dicha entidad, que
son capaces de identificar unívocamente una ocurrencia de una entidad. Es decir, si
conocemos el valor de dichos atributos, seremos capaces de conocer a que ocurrencia de
entidad, entre todas las posibles, hace referencia. Esto implica que los valores de los
atributos clave no se pueden repetir para dos ocurrencias de la misma entidad. En nuestro
ejemplo, seremos capaces de identificar de que automóvil estamos hablando, con sólo
conocer el valor del atributo matrícula, ya que no existe una misma matrícula para dos
automóviles distintos. Los atributos marca, modelo o color no identifican unívocamente
una ocurrencia de la entidad, ya que pueden existir dos automóviles distintos de la misma
marca, modelo o color. En el modelo E/R, un atributo clave se representa subrayando
dicho atributo.
Figura 10
4. Relación: Una relación representa, como su propio nombre indica, una correspondencia
entre dos entidades. Si tenemos dos entidades automóvil y persona, podemos tener una
relación entre ellas. Dicha relación se puede establecer en ambos sentidos:
25
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Cardinalidad 1-1: cada ocurrencia de una entidad se relaciona con una ocurrencia de
otra entidad. Ej.: una persona posee un automóvil. Se representa como indica la Figura
11.
Figura 11
Cardinalidad 1-N: también llamada uno a muchos. Cada ocurrencia de una entidad
puede relacionarse con varias ocurrencias de otra entidad. Ej.: una persona posee
varios automóviles. Se representa como muestra la Figura 12.
Figura 12
Figura 13
8. Entidad débil: se dice que una entidad es débil, o es dependiente de otra, cuando no somos
capaces de conocer a que ocurrencia de entidad nos estamos refiriendo, ni siquiera
conociendo su clave, sino que debemos conocer el valor de algún otro atributo de otra
26
© Grupo EIDOS 3. Diseño conceptual
entidad. Por ejemplo, si tenemos las entidades edificio (con el atributo clave
codigo_edificio) y planta (con el atributo codigo_planta), ésta última es una entidad débil,
ya que no somos capaces de identificar una planta con sólo conocer el código de la planta,
sino que además se necesita conocer el código del edificio al que se hace referencia, para
determinar la planta dentro del edificio.
Figura 14
En general, en una relación se suele representar conjuntamente las cardinalidades máxima y mínima.
En los anteriores casos no se han considerado las cardinalidades mínimas. Éstas vienen a representar la
opcionalidad de la ocurrencia de una entidad en una relación, es decir, si dicha ocurrencia se debe dar
obligatoriamente, o si por el contrario se puede obviar. Los tipos de cardinalidades son los que
aparecen en la Figura 15, (nos fijaremos sólo en un sentido de la relación, el de la izquierda).
Figura 15
Veamos a continuación unos ejemplos para comprender mejor las cardinalidades máxima y mínima.
Como se podrá comprobar, las cardinalidades de una relación se ponen en la última relación a la que
se hace referencia, por ejemplo, si se tienen las entidades alumno y asignatura, la cardinalidad de la
relación un alumno cursa asignaturas, se pondrá al lado de la entidad asignatura.
En el siguiente ejemplo(Figura 16), se tiene una relación 1-1 en la que un automóvil pertenece a una
única persona (cardinalidad máxima 1), sin la posibilidad de que exista un automóvil que no tenga
dueño (cardinalidad mínima 1). Esto significa que en el modelo no interesa tener información de
aquellas personas que no tengan automóvil.
Figura 16
En la Figura 17, se tiene una relación 1-1 en la que una persona puede tener un automóvil como
mucho (cardinalidad máxima 1), o puede no tener ninguno (cardinalidad mínima 0). Esto significa que
el modelo interesa tener información de todas las personas, aunque no tengan automóvil.
27
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 17
En el siguiente ejemplo (Figura 18), se tiene una relación 1-N, en la que un profesor puede dar clase a
muchos alumnos (cardinalidad máxima N), pero como mínimo debe hacerlo a uno (cardinalidad
mínima 1). Esto significa que en el modelo no interesa tener información de aquellos profesores que
no dan clase.
Figura 18
En el siguiente ejemplo, se tiene una relación N-N, en la que una persona puede tener varios
automóviles (cardinalidad máxima N), pero puede que no tenga ninguno (cardinalidad mínima 0). Esto
significa que en el modelo interesa tener información de todas las personas, aunque no tengan
automóvil.
Figura 19
Para concluir esta sección se verá un ejemplo completo que representará todos los conceptos vistos
hasta ahora. Supongamos que se desea establecer un modelo conceptual para la gestión de una
biblioteca. Se desean tener almacenados todos los libros que la componen.
Para cada libro interesa conocer el ISBN, el título, el autor o autores, la editorial, el año de publicación
y la materia. De cada autor se quiere conocer su nombre, apellidos y nacionalidad.
Un autor podrá haber escrito varios libros, de la misma forma que en un libro pueden participar varios
autores. De la editorial se desea conocer el nombre y la ciudad.
A dicha biblioteca podrán estar suscritos varios usuarios. De ellos se quiere saber su DNI, número de
socio, nombre, apellidos, dirección y teléfono. Por cuestiones directivas, se limita el número de
ejemplares prestados a cada usuario a uno.
Se dispone, a su vez, de un único ejemplar de cada libro, por lo que un libro prestado a un usuario, no
podrá ser prestado a otro hasta que se devuelva. Deberá quedar constancia de la fecha de préstamo de
cada ejemplar.
28
© Grupo EIDOS 3. Diseño conceptual
Figura 20
Lo más destacable del anterior ejemplo es la entidad préstamo. Es una entidad débil que depende de
libro y de socio, ya que para diferenciar un préstamo de otro, se necesita saber no sólo el libro, sino el
socio al cual se ha prestado. También se pueden observar que las cardinalidades mínimas son 1. Esto
quiere decir que sólo se guardará información de las entidades cuando exista, al menos, una ocurrencia
de la entidad. Las únicas relaciones que tienen cardinalidad opcional, son las que tienen como origen o
destino a la entidad préstamo, lo cual es lógico, ya que tendremos información de todas las entidades,
aunque todavía no se haya realizado ningún préstamo.
El problema que nos planteamos es el siguiente. Supóngase que se desea informatizar una tienda de
discos. Para ello se desean tener almacenados los nombres de todos los discos disponibles, además de
sus cantantes y canciones. Así mismo se desean almacenar los clientes que han comprado en dicha
tienda. Pues bien, empezaremos identificando las entidades, entendiendo por entidad un grupo de
características que tienen entidad propia. Como primera entidad, podemos establecer los discos que se
venden, ya que se desea conocer información de ellos, como puede ser un código que lo identifique
dentro de la estantería. Por otro lado se desea almacenar todos los artistas que intervienen en los discos
de nuestra tienda, y para cada uno de ellos se desea conocer su nombre y apellidos, por lo tanto ya
tenemos identificada una segunda entidad. Además, se desea conocer todas las canciones que están
disponibles en los discos, identificada cada una de ellas por un código de canción, y que además
tendrán sus propias letras. Pues ya tenemos la tercera entidad. La cuarta estará formada por los
clientes, de los cuales se desea almacenar su nombre, apellidos, dirección y teléfono, y que podrán
estar identificados internamente por un código de cliente.
Figura 21
29
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Una vez establecidas las entidades, sólo nos queda relacionarlas. Podemos observar las siguientes
relaciones:
1. Entre disco y canción: en un disco pueden aparecer varias canciones, y cada canción puede
estar en varios discos (N-M).
2. Entre cantante y canción: un cantante puede componer varias canciones, y una canción puede
estar compuesta por varios cantantes (N-M).
3. Entre cliente y disco: un cliente puede comprar varios discos, pero un disco sólo puede ser
comprado por un cliente 1-N.
Figura 22
Vamos a plantearnos otro problema. Supongamos que se desea tener almacenados todos los datos de
los profesores de una empresa dedicada a impartir cursos, así como una breve descripción de éstos, y
los alumnos a los cuales se les ha impartido. Empezamos identificando entidades.
De un profesor se desea conocer su nombre y apellidos, dirección y despacho, por lo tanto establece
una entidad. Otra entidad podría ser el alumno, del cual se desea conocer su nombre, apellidos,
dirección y teléfono.
Ni que decir tiene que el curso describe otra entidad, de la cual se desea conocer su descripción. Sin
embargo, podemos recurrir a un procedimiento muy usual, denominado tipificación de estados, muy
usado en el diseño conceptual, y que consiste en tener una entidad que tipifique los posibles estados
que puede tomar un atributo.
La principal ventaja de este procedimiento radica en que muchas veces supone un ahorro de espacio de
almacenamiento (por ejemplo al identificar nombres de ciudades largas con un solo número) además
de una estandarización de los datos almacenados (el estado sólo se almacena una vez).
Por ejemplo podemos tipificar las ciudades, para lo cual creamos una nueva entidad ciudad, donde se
almacenará un código y la descripción de la ciudad. Cuando almacenemos la ciudad de un alumno,
sólo deberemos especificar el código de la ciudad.
30
© Grupo EIDOS 3. Diseño conceptual
Figura 23
Una vez establecidas las entidades, vamos a definir las relaciones entre ellas.
1. Profesor y Curso: un profesor puede impartir varios cursos, pero un curso sólo puede ser
impartido por un profesor (1-N).
2. Alumno y Curso: un alumno puede asistir a varios cursos, y a un curso pueden asistir varios
alumnos (N-M).
3. Alumno y Ciudad: un alumno vive en una ciudad, y una ciudad puede tener varios alumnos
(1-N).
Figura 24
Cabe destacar que el atributo calificación se da como consecuencia de la relación entre las entidades
curso y alumno. Por lo que podrá ser introducido en la entidad intermedia que surja cuando se haga el
paso a tablas (véase siguiente capítulo).
31
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Vamos a ver un último ejemplo. Supóngase un banco que desea almacenar todos sus clientes, además
de los productos que puede ofrecer a éstos. Cada cliente podrá escoger entre todos estos productos el o
los que más le plazcan (créditos, fondos de inversión, libretas de ahorro, etc.).
De la misma forma, dicho banco tiene intereses en otras empresas, por lo que desea conocer en todo
momento la situación de dichas empresas, para poder mejorar su política de inversiones.
Puesto que dicho banco esta constituido como sociedad anónima, desea almacenar todos los
componentes de su consejo de administración (actuales y ex-miembros) así como todas las actas de las
reuniones ordinarias y extraordinarias.
Las decisiones de inversión en estas empresas saldrán como resultado de dichas reuniones, así como la
oferta de nuevos productos.
Como habrá podido observar, este ejemplo es un poco más complejo, pero no desespere, el proceso es
similar al de los demás ejemplos. Empezaremos definiendo entidades y las veremos representadas en
la Figura 25.
1. Cliente: se desea conocer su nombre, apellidos, dirección y NIF, y estará identificado por un
código interno cod_cliente.
2. Producto: del cual queremos saber su descripción y estará identificado por un código interno
cod_producto.
3. Empresa: identifica las empresas en las cuales el banco ha invertido. De ellas se desea conocer
su código, nombre y CIF.
4. Consejo: establece los componentes del consejo de administración. Para ello se almacenará el
nombre, apellidos y código de cargo de cada uno de sus componentes, y si el cargo es vigente
o no. Podremos utilizar una nueva entidad que tipifique los tipos de cargo.
5. Tipo_cargo: describe los posibles cargos que puede tomar una persona en el consejo de
administración, y esta compuesto por un código de tipo de cargo, y una descripción del mismo
(secretario, presidente, etc.).
6. Reunión: entidad encargada de describir la información de las actas de las reuniones. Sus
atributos son cod_reunión, fecha, extraordinaria, que especifica si la reunión ha sido ordinaria
o extraordinaria y una descripción.
Figura 25
32
© Grupo EIDOS 3. Diseño conceptual
1. Cliente y producto: cada cliente puede escoger varios productos, y cada producto puede ser
ofrecido a varios clientes.
2. Consejo y cargo: un miembro del consejo sólo tiene un cargo, y cada cargo puede pertenecer a
más de un miembro.
3. Reunión y consejo: a cada reunión pueden asistir varios miembros del consejo de
administración, y cada miembro puede asistir a más de una reunión.
4. Reunión y producto: de cada reunión puede salir la oferta de mas de un nuevo producto pero
cada producto nuevo sólo puede salir de una reunión.
5. Reunión y empresa: de cada reunión pueden salir decisiones de invertir en más de una
empresa, y cada decisión de inversión sólo sale de una reunión.
33
Diseño lógico
Introducción
Como ya se ha señalado, el diseño lógico de una base de datos consta de dos etapas: el diseño lógico
estándar y el diseño lógico específico. En el diseño lógico estándar, se toma el esquema conceptual
resultante de la fase de diseño conceptual, y teniendo en cuenta los requisitos de proceso, de construye
un esquema lógico estándar (ELS), que se apoya en un modelo lógico estándar (MLS), que será el
mismo modelo de datos soportado por el SGBD a utilizar (relacional, jerárquico, etc.), pero sin las
restricciones de ningún producto comercial en concreto. En nuestro caso se utilizará el MLS
relacional. Una buena forma de describir el ELS es utilizando el lenguaje estándar del MLS (por
ejemplo SQL).
Una vez obtenido el ELS, y considerando el modelo lógico específico (MLE) propio del SGBD a usar
(ORACLE, INFORMIX, SQL-SERVER, etc.), se elabora el esquema lógico específico (ELE). Al
igual que en el caso anterior, una buena forma de describirlo es utilizando el lenguaje de definición de
datos (LDD) del producto especifico utilizado (en el caso de SQL-SERVER, se usará el TRANSACT
SQL). El diseño lógico específico está muy ligado a la fase de diseño físico, ya que ambos dependen
mucho del SGBD que se utilice.
En la fase de diseño lógico, además de las herramientas ya descritas (MLS, MLE, lenguajes SQL), se
disponen de otras que permiten establecer un buen diseño lógico, como por ejemplo la normalización,
la desnormalización, etc., que ya se verán mas adelante en este tema.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• Cada entidad se transforma en una relación: esto es, cada entidad genera una tabla, con sus
mismos atributos, incluyendo las claves.
• Cada relación N-M genera una tabla: las relaciones entre entidades con cardinalidad N-M
generan una tabla, con los atributos clave de ambas entidades.
• Cada relación 1-N importa las claves de la entidad con las que se relaciona: cada relación con
cardinalidad 1-N importa los atributos clave que contiene la entidad con cardinalidad N.
Para entender mejor el funcionamiento de este método, veamos el paso a tablas del ejemplo visto en el
tema anterior acerca de la gestión de una biblioteca. La entidad libro está relacionada con la entidad
editorial con cardinalidad 1-N, por lo tanto importa la clave de la entidad con cardinalidad 1. A su vez,
esta relacionada con la entidad con la entidad autor, pero en este caso, la cardinalidad es N-M, lo que
implica que se generará una tabla intermedia, en la que se almacenarán las claves de ambas entidades.
Esta tabla, a la que denominaremos Libro_autor mantiene la información de los códigos de libros junto
con los códigos de autores. Posteriormente, si se desea extraer más información, tanto del libro como
del autor, se deberá acceder a sendas tablas. Por último se dispone de la entidad Préstamo, que es
dependiente tanto de la entidad Libro como de la entidad Usuario, lo que quiere decir que se generará
una tabla, con los atributos de la entidad Préstamo además de las claves de las entidades de las que es
dependiente, es decir, ISBN y Num_socio, que entrarán como claves en dicha tabla. Esta última
relación obtenida, mantiene información de qué libros han sido prestados a qué usuarios y en qué
fecha. El esquema de las tablas resultantes es el que se muestra en la Figura 26
Figura 26
Veamos ahora el paso a tabla de otro ejemplo visto en el tema anterior, cuyo esquema conceptual es el
que muestra la Figura 27.
1. Cliente-Disco: puesto que es una relación 1-N, la entidad disco generará una tabla con sus
atributos, e importará el atributo clave de la entidad con cardinalidad 1, es decir, cod_cliente.
A su vez, la entidad cliente generará su propia tabla, con sus propios atributos, es decir,
cod_cliente, nombre, apellidos y telefono.
36
© Grupo EIDOS 4. Diseño lógico
3. Canción-Cantante: en este caso se tiene una relación N-M, es decir, se generará una tabla
intermedia, con los atributos claves de las entidades que relaciona, es decir, cod_canción y
cod_cantante.
4. Disco_Cantante: siguiendo el mismo razonamiento, al ser una relación N-M, se generará una
tabla intermedia, con los atributos cod_cantante y cod_disco.
Figura 27
Con todo esto, el esquema lógico resultante del esquema conceptual anterior, queda como aparece en
la Figura 28.
Figura 28
• Etapa de estructuración: donde el objetivo primordial es encontrar un esquema que sea una
representación fidedigna del mundo real. La forma de lograrlo es mediante el particionamiento
horizontal, para evitar valores nulos, y el proceso de normalización.
• Etapa de reestructuración: donde se tienen en cuenta aspectos más ligados con el nivel físico,
y que consiste el modificar el esquema obtenido en la fase anterior para adaptarlo a las
consideraciones de eficiencia. Esta etapa, que debería ser ajena al diseño lógico, se considera
aquí debido a la falta de flexibilidad de los SGBD, obligando a trasladar a esta etapa aspectos
37
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Miguel de
123BB3-3 El Quijote Ibérica
Cervantes
El impacto de las
113ZD3-0 Francisco Hierves
TI
Rimas y
2322-DD G. A. Becquer Alcalá
Leyendas
Tabla 1
Tenemos información sobre dos libros, con su autor y su editorial correspondiente, y un artículo (El
impacto de las TI) que, como es obvio, no tiene editorial. En este caso, podría ser conveniente "partir"
dicha tabla horizontalmente en otras dos, es decir llevar parte de la información a una tabla, y parte a
otra.
Aquí la diferenciación se establece entre aquellas filas que tienen editorial, es decir, libros, y aquellas
que no tienen editorial, o artículos. Por lo tanto, se crean dos tablas: una para albergar los libros y otra
para ubicar los artículos.
La Tabla 2 posee la tabla de libros, mientras que la Tabla 3 contiene los artículos.
Tabla 2
38
© Grupo EIDOS 4. Diseño lógico
Tabla 3
Con esto, lo que hemos conseguido es eliminar la existencia de valores nulos no aplicables. Un valor
nulo es aquel que representa información desconocida, inexistente o no válida (en nuestro caso el valor
del atributo editorial en el artículo). Los valores nulos pueden ser aplicables o no aplicables. Mientras
los no aplicables no cambian, es decir, permanecen nulos, los aplicables pueden dejar de serlo en
algún momento.
Esto que acabamos de realizar, es el primer paso que se debe seguir en el proceso de estructuración de
relaciones. Sin embargo, el particionamiento horizontal no sólo se utiliza aquí, sino que también puede
usarse en la fase de reestructuración para conseguir una mayor eficiencia. Por ejemplo, si se dispone
de una base distribuida (para entendernos, una base de datos con distintos nodos, situados en distintas
localizaciones, con determinada información en cada uno) con información acerca de clientes, y
suponiendo que se dispone de dos nodos, uno en Madrid y otro en Barcelona, lo lógico sería pensar en
situar la información de aquellos clientes que residen en Barcelona en dicho nodo, y ubicar
únicamente la información de los clientes que viven en Madrid en dicho nodo. Los motivos son los
siguientes:
• Si se sitúa toda la información en un único nodo, el coste del acceso remoto aumenta (si toda
la información está en Madrid, una consulta de un cliente que vive en Barcelona se debería
realizar al nodo de Madrid, con el coste que ello supone).
En este caso, pues, lo que se deberá realizar en un particionamiento horizontal, para situar aquellas
filas que correspondan a clientes de Madrid, en el nodo de Madrid, y aquellas filas que correspondan a
clientes de Barcelona, en el nodo de Barcelona.
Supongamos, por ejemplo, que tenemos el siguiente esquema lógico, correspondiente a una base de
datos para gestionar los alumnos de una empresa de educación a distancia.
Figura 29
1. Se dispone de dos tablas, alumno y profesor. La tabla alumno guarda sus datos personales, y
las calificaciones obtenidas en cada una de las asignaturas, mientras que la tabla profesor
39
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
almacena, además de sus datos personales, las aulas donde dicho profesor imparte cada una de
las clases.
2. La base de datos se encuentra distribuida, es decir, se dispone de un nodo en cada una de las
provincias, donde se almacena la información relevante a ésta.
3. Los alumnos pueden optar por dos ramas, ciencias o letras, y para cada una de ellas se
imparten dos asignaturas, arte y latín en letras, y matemáticas y ciencias en la rama de
ciencias.
Nos planteamos, entonces, aumentar la eficiencia de la base de datos, para adecuarla a las necesidades
de cada una de las provincias donde se encuentra ubicada la base de datos.
Puesto que en cada nodo sólo precisa información relevante a éste, podemos optar por tres opciones:
Opción 1: colocar la base de datos en un sólo nodo (centralizado), al que accederán los demás.
Opción 2: colocar la parte de información relevante a cada nodo en cada uno de ellos.
Ventajas inconvenientes
Se disminuye el espacio de
El resto de las provincias deberá acceder a
almacenamiento (una sola copia de la
la provincia donde se encuentre la base de
Opción 1 información), y en la provincia donde se
datos, con el tráfico de red y aumento de
encuentre la base de datos se disminuirá
tiempo de acceso que esto supone.
el tiempo de acceso
Tabla 4
Analizando la anterior tabla, y teniendo la premisa expuesta de que cada provincia trabajará de manera
aislada, la opción que más nos interesa es ubicar cada parte de información relevante a cada una de
éstas, en su nodo local. La pregunta que surge ahora es ¿cómo se puede realizar?; pues bien, la
respuesta es bastante simple: mediante el particionamiento horizontal. Para ello se deben seguir los
siguientes pasos:
Paso 1: Realizar una consulta para separar las filas correspondientes a cada provincia, en cada una de
las tablas.
40
© Grupo EIDOS 4. Diseño lógico
Paso 2: Ubicar la información obtenida en cada uno de los nodos correspondientes a dichas provincias.
Como ejemplo, supóngase que se desean ubicar las filas de las tablas alumno y profesor en el nodo
provincial de Madrid. Para ello se realizará una "criba" en ambas tablas donde el campo provincia sea
Madrid. La sentencia SQL que realiza se ve en el Código fuente 1.
Código fuente 1
No se preocupe demasiado si no entiende las anteriores sentencias, ya que se verán en detalle más
adelante. Quédese simplemente con la idea de su funcionamiento, que es el de obtener de ambas tablas
solamente aquellas filas que corresponden a la provincia de Madrid. De esta manera es preciso
proceder para el resto de las provincias.
Otra de las cuestiones que hemos planteado es la referente a las ramas por las que puede optar un
alumno: letras o ciencias. Podemos observar como en la tabla alumno, se encuentran atributos que
hacen referencia a las calificaciones obtenidas en ambas ramas, lo que supone que siempre se darán, al
menos, dos valores nulos inaplicables en cada fila de la tabla, ya que un alumno puede optar por una
de las dos ramas, pero no por ambas. Llegados a este punto, podremos decidir separar las filas de
dicha tabla entre otras dos, denominadas alumno_ciencias y alumno_letras, cada una de ellas
almacenando los atributos correspondientes a cada una de estas ramas, respectivamente. De esta
manera, en la tabla alumno_letras, estarían solamente las filas o tuplas correspondientes a alumnos que
han escogido la rama de letras, y en la tabla alumno_ciencias, aquellos que han optado por la rama de
ciencias. La forma de proceder es, nuevamente, mediante un particionamiento horizontal, con el
objetivo de eliminar estos valores nulos no aplicables. Las tablas quedarían entonces como muestra la
Figura 30.
Figura 30
41
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Tabla 5
Dada la Tabla 5, podría interesarnos tener varias tablas: una que contenga la información del
proveedor, con los atributos nombre_proveedor y ciudad proveedor, otra con la información del
cliente con los atributos nombre_cliente y ciudad_cliente y otra con la información de los repartos con
los atributos cod_proveedor, cod_cliente, cod_material y cantidad. Para ello realizamos un
particionamiento vertical, sobre estos atributos.
nombre_proveedor ciudad_proveedor
Pepe Sevilla
Luis Madrid
Antonio Barcelona
Tabla 6
nombre_cliente ciudad_cliente
Juan Sevilla
Paco Cuenca
Ángel Manresa
Tabla 7
Tabla 8
42
© Grupo EIDOS 4. Diseño lógico
El resultado es que tenemos el mismo número de filas en todas las tablas, pero más tablas con menos
atributos. Este proceso se realiza en la reestructuración, ya que las ventajas que ofrece están
relacionadas con la eficiencia. Entre ellas destacan:
• Aumento de la concurrencia: cada vez que un usuario accede a una fila de la tabla, ésta se
bloquea, es decir, no puede ser accedida por otro usuario. Al dividir un tabla en más, la
concurrencia aumenta, es decir, si un usuario accede a una fila de una tabla, otro podrá acceder
a la misma fila en otra tabla.
• Aumento de la velocidad de consulta / actualización: al ser las tablas más pequeñas, una
consulta o actualización podrá realizarse en un menor tiempo, ya que se necesitarán menos
accesos a disco para completar la acción.
Por contra, la principal desventaja que tiene este método es el aumento del tiempo de consulta /
actualización si se desea acceder a dos o más tablas. Es por ello por lo que hay que realizar un estudio
pormenorizado de la probabilidad de consultas que se va a realizar. Para ello existen varios algoritmos,
por ejemplo el de Navathe y Ra, en los que no entraremos, ya que escapan del objetivo del presente
curso.
Por ejemplo, supóngase que se dispone un esquema lógico con una sola tabla, en la que se almacenan
los datos personales de los empleados de una empresa.
Figura 30
Si nos damos cuenta, existen muchos atributos, a los que deberemos acceder en cada consulta, aunque
no nos interese su valor. Esto es debido a que, normalmente, el acceso (o bloqueo de tupla) se realiza
al nivel de fila o tupla, es decir, se accede a toda la fila de la tabla. Puede que esto no nos sea útil, por
ejemplo, sin únicamente deseamos obtener el sueldo de un empleado, ya que deberemos obtener toda
la fila correspondiente a ese empleado, para extraer un solo atributo con todos los inconvenientes que
esto supone, como por ejemplo una disminución de la concurrencia (otro usuario no podrá acceder
simultáneamente a esa fila, ni siquiera para consultar el valor de otro atributo), un aumento del tiempo
de proceso (debemos procesar toda la fila para extraer un solo atributo), un mayor consumo de
memoria (por el mismo motivo), un aumento del número de operaciones de Entrada / salida (puede
que la fila entera no quepa en el buffer de memoria, y debamos realizar más accesos a la base de
datos), etc.
Nos plantemos entonces un particionamiento vertical. Puesto que la única transacción (consulta) que
se va a realizar (de momento) es la consulta del sueldo de un empleado, se puede separar esta tabla en
43
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
otras dos: una con el atributo sueldo, y otra con el resto. De esta manera solventamos los anteriores
inconvenientes que se presentaban.
Para identificar unívocamente cada una de estas filas, y asociarlas a las filas de la tabla homóloga, se
pueden usar dos métodos:
En esta caso optamos por la segunda opción, utilizando el DNI, como campo unión entre ambas tablas,
quedando el esquema lógico particionado verticalmente de la como indica la Figura 31.
Figura 31
Sin embargo, ¿que pasaría si ahora se necesita saber no sólo el sueldo, sino también la categoría de un
empleado?. Pues bien, el esquema obtenido no nos valdría (bueno, de hecho si valdría, pero no sería
demasiado eficiente), ya que ahora se necesitaría realizar una operación de join o unión entre ambas
tablas, para obtener ambos valores. Destacar que la operación de join es bastante costosa en tiempo de
ejecución. La solución, en este caso, pasaría por añadir el campo categoría a la tabla anteriormente
extraída.
Figura 32
Particionamiento mixto
El particionamiento mixto consiste en un híbrido entre ambos tipos de particionamiento. O bien se
aplica un particionamiento vertical a una tabla previamente particionada horizontalmente, o bien se
aplica un particionamiento horizontal a una tabla particionada verticalmente. Por lo tanto, existen dos
opciones:
• Realizar primero un particionamiento horizontal, por ejemplo para ubicar las distintas filas de
una tabla en distintos nodos de una base distribuida (como el ejemplo visto anteriormente), y
44
© Grupo EIDOS 4. Diseño lógico
posteriormente realizar un particionamiento vertical sobre las tablas obtenidas, para conseguir
un mayor ajuste de los tiempos de acceso a datos (evitar acceder a datos irrelevantes).
• Realizar primero un particionamiento vertical, para conseguir disminuir los tiempos de acceso
y posteriormente realizar un particionamiento horizontal sobre dichas tablas.
Figura 33
Teoría de la normalización
El proceso de normalización consiste en la aplicación de un conjunto de reglas, con el objeto de
verificar que el esquema relacional obtenido en esta fase cumple un cierto conjunto de reglas. La
normalización se podría considerar prácticamente como el grueso de la fase de diseño lógico, ya que
es el encargado de modificar el esquema conceptual obtenido en la fase anterior, para que cumpla el
primero de los objetivos de las bases de datos, el de que ha de representar fielmente la realidad. Por lo
tanto es el segundo paso a realizar dentro de la fase de diseño lógico, después de la eliminación de
valores nulos no aplicables (particionamiento horizontal), y se corresponde con la etapa de
estructuración.
La normalización se puede definir como el proceso de sustituir una relación o tabla, por un conjunto
de esquemas equivalentes que representen la misma información, pero que no presenten cierto tipo de
anomalías a la hora de realizar operaciones sobre ella. Las anomalías que puede presentar una relación
son de tres tipos:
45
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Tabla 9
Si en este momento se desea añadir un nuevo proveedor, no se puede reflejar en la relación, ya que
dicho proveedor todavía no ha realizado ningún reparto.
• Anomalías de borrado: vienen determinadas por la perdida de información que no se desea, al
eliminar una fila de una relación. Por ejemplo, supóngase el caso anterior. Si se desea borrar el
reparto realizado por el proveedor 3, al existir únicamente una fila con dicho proveedor,
perderemos toda la información relacionada con él, es decir, su ciudad y su categoría.
Por lo tanto, lo que se busca con el proceso de normalización es eliminar estos tres tipos de anomalías.
Consiste en conseguir, mediante varios pasos, distintas formas normales. Se dice que un esquema de
relación esta en una determinada forma normal si satisface un determinado conjunto de restricciones.
Dichas formas normales son la primera forma normal (1FN), la segunda forma normal (2FN) y la
tercera (3FN), definidas por Codd, la forma normal de Boyce-Codd (FNBC), definida por Boyce y
Codd, y la cuarta y quinta forma normal (4FN y 5FN), definidas por Fagin. La principal característica
que cumple cada una de estas formas normales es que la de nivel superior incluye a la de nivel
inferior, es decir, una relación que esté en 2FN estará en 1FN, una que este en 3FN estará en 1FN y
2FN, como muestra la Figura 34.
Figura 34
46
© Grupo EIDOS 4. Diseño lógico
Para comprender mejor el proceso de normalización y la obtención de las formas normales, veamos el
concepto de dependencia funcional. Sea el esquema de relación R definido sobre el conjunto de
atributos A y sean X e Y subconjuntos de A llamados descriptores. Se dice que Y depende
funcionalmente de X, o que X determina o implica a Y si, y sólo si, cada valor de X tiene asociado en
todo momento un único valor de Y, y se representa X ---> Y.
Por ejemplo, si se tiene la relación Empleado, compuesta por los atributos DNI, nombre, salario, etc.,
se puede asegurar que DNI ---> Nombre , ya que por cada DNI tenemos un nombre, es decir, para un
mismo DNI no pueden existir más de un nombre.
De la misma forma, se puede concluir que entre Salario y Nombre no existe dependencia funcional, ya
que para un mismo salario pueden existir varios nombres de empleados, (varios empleados pueden
cobrar lo mismo).
Tabla 10
Por ejemplo, si se tiene la relación Libro con los atributos ISBN, Cod_socio y Fecha_préstamo, se
tiene:
Tabla 11
ya que para un libro y un socio sólo existe una fecha de préstamo (1), mientras que el mismo libro se
puede prestar varios días (2) y un mismo socio puede tomar prestado uno o varios libros más de un día
(3). Por estos motivos, se puede concluir que Fecha_préstamo tiene dependencia funcional completa
de ISBN y socio.
X --------> Y
Y --------> Z
Y ----/---> X
47
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
se dice, entonces, que Z tiene una dependencia transitiva respecto de X a través de Y, y se representa
X ---- ----> Z.
Por ejemplo, si se tiene la relación Empleado, con los atributos Nombre, Dirección y Cod_postal, se
tiene:
cada empleado sólo tiene una dirección (1), y cada dirección sólo tiene un código postal (2), mientras
que varios empleados pueden vivir en una misma dirección (3). Por lo tanto Nombre --- --->
Cod_postal.
Primera forma normal (1FN): Una relación está en 1FN si cada atributo de dicha relación, tiene un
sólo valor en cada fila. La siguiente relación, por ejemplo, no está en 1FN, ya que la primera fila tiene
dos valores para el atributo asignatura.
10 L. Fernández Matemáticas
Lenguaje
20 P. Alonso Ciencias
Tabla 12
La forma de transformar esta relación a otra que sea 1FN sin pérdida de información, es crear una fila
por cada valor del atributo repetido, de la forma que indica la Tabla 13.
10 L. Fernández Matemáticas
10 L. Fernández Lenguaje
20 P. Alonso Ciencias
Tabla 13
Segunda forma normal (2FN): Una relación está en 2FN cuando, además de estar en 1FN, todos los
atributos que no forman parte de ninguna clave candidata suministran información acerca de la clave
completa, no de una parte de la clave. O lo que es lo mismo, cada atributo no principal (que no forma
parte de la clave) tiene dependencia funcional completa respecto de cada una de las claves. Por
ejemplo, si se tiene la relación Libro con los atributos ISBN, Cod_socio y Editorial, de los cuales los
atributos clave son ISBN y Cod_socio, y se tiene la dependencia funcional que sigue:
48
© Grupo EIDOS 4. Diseño lógico
dicha relación no esta en 2FN, ya que el atributo no principal editorial, depende funcionalmente de una
parte de la clave, no de toda ella. Para transformarla a otro esquema equivalente, que esté en 2FN, se
descompone dicha relación en otras dos:
R1 = {ISBN, Cod_socio}
R2 = {ISBN, Editorial}
Tercera forma normal (3FN): Una relación esta en 3FN cuando, además de estar en 2FN, no existe
ningún atributo no principal que dependa transitivamente de alguna de las claves de la relación. Por
ejemplo, si tenemos la relación Empleado, con los atributos Nombre, Dirección y Cod_postal, cuya
clave es el atributo nombre, con las siguientes dependencias funcionales:
dicha relación no se encuentra en 3FN, al tener que el atributo no principal cod_postal depende
transitivamente de la clave nombre. Para transformarla a 3FN, se descompone dicha relación en otras
dos equivalentes, que cumplan la tercera forma normal:
R1 = {Nombre, Dirección}
R2 = {Dirección, Cod_postal}
Ahora las nuevas dependencias que tenemos son (1) en R1 y (2) en R2, por lo que se ha eliminado la
transitividad, es decir, dicho esquema se encuentra en 3FN.
Las formas normales que se verán ahora no son muy utilizadas, ya que supone que el esquema este
muy fuertemente normalizado, cosa que puede no interesar en la mayoría de los casos, así que
simplemente se mencionarán.
Se dice que una relación esta en forma normal de Boyce-Codd cuando se tiene que para toda
dependencia funcional se tiene que el implicante (la parte derecha de la dependencia) es clave. La
cuarta y quinta forma normal dependen de un tipo especial de dependencias, denominadas
multivaluadas y de unión respectivamente.
49
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Tabla 14
Lo primero que cabe preguntarse es ¿está normalizado?. La respuesta es no, ya que se producen
anomalías:
• Inserción: no podemos almacenar un proveedor, hasta que no haya realizado algún reparto.
En la Tabla 15 iremos modificando el anterior esquema, hasta lograr que este normalizado, con el
objeto de eliminar las anteriores anomalías. Lo primero es identificar las dependencias del esquema:
Tabla 15
Lo siguiente es encontrar una clave para la tabla, es decir, un atributo o conjunto de atributos que
identifiquen unívocamente cada tupla de la relación. En nuestro caso, estaría formada por los atributos
cod_proveedor y cod_material, ya que la combinación de estos valores no se repiten para más de una
fila en la tabla.
• 1FN: el esquema está en 1FN, ya que en cada fila tenemos un único valor para cada atributo.
Un esquema lógico, normalmente, está por defecto en 1FN, al menos.
• 2FN: el esquema no está en 2FN, ya que, aunque está en 1FN, nos encontramos con la
siguiente dependencia:
50
© Grupo EIDOS 4. Diseño lógico
Puesto que la clave de la relación esta formada por los atributos cod_proveedor y
cod_material, tenemos que hay un atributo no principal (ciudad), que depende funcionalmente
de una parte de la clave (cod_proveedor), no de toda ella. Por lo tanto, deberemos
descomponer dicha relación en otras dos, de tal forma que el atributo ciudad dependa de toda
la clave.
Una posible forma, puede ser llevar el atributo ciudad junto con la parte de clave de la que
depende (cod_proveedor) a otra relación, junto con las dependencias funcionales que le
afectan. Otra forma de proceder es dejar en una relación aquellos atributos que forman parte
de la dependencia, y llevar los demás a otra relación. Por lo tanto, nos quedan las relaciones
que muestra la Tabla 16.
cod_proveedor,
Cod_proveedor,cod_material
Relación 1 cod_maerial cod_proveedor,cod_material
cantidad
cantidad
Cod_proveedor
cod_proveedor ciudad
Relación 2 ciudad cod_proveedor
ciudad categoría
categoría
Tabla 16
De esta manera, ahora la dependencia anterior ya es completa con respecto la clave, ya que en
la segunda relación la clave es ahora cod_proveedor, por lo que el atributo ciudad depende de
toda la clave.
• 3FN: Hasta aquí el esquema está en 1FN y 2FN, pero no en 3FN, ya que el atributo categoría
en la relación 2 depende transitivamente de la clave de dicha relación, que es cod_proveedor,
es decir,
cod_proveedor ciudad
ciudad categoría
cod_proveedor categoría
Por lo tanto deberemos descomponer la relación 2 en otras dos, de manera tal que se evite la
dependencia funcional transitiva entre ambos atributos.
51
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Tabla 17
Por lo tanto hemos conseguido obtener un esquema normalizado en 3FN, mediante la descomposición
de una relación inicial en otras tres. De este modo hemos conseguido eliminar las dependencias que se
nos planteaban en la relación original:
• Inserción: si queremos insertar un nuevo proveedor, no hace falta que haga ningún reparto, ya
que bastará con insertarlo en la relación 2.
• Actualización: si cambiamos la categoría de una ciudad, no hace falta cambiarla en todas las
filas, sino sólo una vez en la relación 3.
Veamos ahora otro ejemplo de normalización. Supongamos esta vez que tenemos el esquema lógico
de la Tabla 18, que representa los cursos impartidos por un profesor, junto con su fecha, y domicilio
de éste.
Cod_post
Profesor Fecha Curso Precio Domicilio
al
Tabla 18
• Inserción: No podemos insertar los datos de un profesor hasta que éste no haya impartido un
curso.
52
© Grupo EIDOS 4. Diseño lógico
• Borrado: Si borramos la impartición del curso de Delphi, perdemos los datos de dicho curso, y
del profesor que lo imparte.
• Actualización: Si modificamos la dirección del profesor Juan, debemos hacerlo en dos filas y
si modificamos el precio de un curso o el código postal de un domicilio, también.
Procedemos de igual forma que en el ejemplo anterior. Lo primero es identificar la clave, que en
nuestro caso está compuesta por los atributos profesor, fecha y curso, ya que el conjunto de estos tres
atributos, identifica de manera unívoca cada fila de la relación. El siguiente paso es identificar las
dependencias funcionales.
Para cada valor diferente del atributo curso, podemos existe un valor
Curso precio diferente para el atributo precio, es decir, el atributo curso identifica el
atributo precio.
Tabla 19
Ahora debemos comprobar si dicha relación cumple las reglas de cada una de las formas normales:
• 1FN: Puesto que para cada fila existe un solo valor para cada atributo, la relación se encuentra
en 1FN.
es decir, el atributo precio no tiene dependencia funcional completa con respecto a la clave,
sino sólo a una parte. Por lo tanto, desglosamos esta relación en otras dos, dejando en una
dicha dependencia junto con sus atributos, y en la otra las demás.
Tabla 20
53
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
profesor domicilio
Por lo tanto, desglosamos la relación 1 en otras dos, una que contenga los atributos
referentes a dicha dependencia y otra con los demás.
Profesor
profesor domicilio
Relación 1 Domicilio profesor
domicilio cod_postal
Cod_postal
Curso
Relación 2 curso precio curso
Precio
Profesor
Profesor, fecha
Relación 3 Fecha
curso
Curso
Tabla 21
Esta relación ya se encuentra en 2FN, ya que, además de estar en 1FN, no tiene dependencias
no completas de ningún atributo no principal con respecto de la clave.
• 3FN: El anterior esquema no se encuentra en 3FN, ya que la relación 1 tiene una dependencia
transitiva con respecto de la clave:
profesor domicilio
domicilio cod_postal
Como domicilio no depende de profesor, ya que en un mismo domicilio pueden vivir varios
profesores, tenemos una dependencia transitiva del atributo cod_postal con respecto de la
clave:
profesor cod_postal
Por lo tanto, para romper esta dependencia, podemos llevar cada una de ellas a una nueva
relación, con lo que nos queda lo que indica la Tabla 22.
Ahora podemos asegurar que el esquema se encuentra normalizado hasta la tercera forma
normal.
Profesor
Relación 1 profesor domicilio profesor
Domicilio
Curso
Relación 2 curso precio curso
Precio
54
© Grupo EIDOS 4. Diseño lógico
Profesor
Profesor,
Relación 3 Fecha
fecha curso
Curso
Domicilio
Relación 4 Domicilio cod_postal domicilio
Cod_postal
Tabla 22
Lo que hemos conseguido es sustituir un esquema en el que sólo existía una relación, en otro con
cuatro, que mantiene la misma información, pero que no presenta las anomalías que se daban en el
original:
Un último detalle a tener en cuenta es el de la descomposición sin perdida de dependencias, esto es,
que no se queden dependencias en el camino, para que el esquema original y el normalizado tengan la
misma información.
Proceso de desnormalización
El proceso de desnormalización hace referencia justo al proceso inverso de normalización que se
acaba de ver. En estos momentos, el lector puede preguntarse que para qué se procede a normalizar un
esquema, cuando posteriormente se va a desnormalizar, es decir, a dejarlo como estaba. La respuesta
es simple; primero se procede a estructurar el esquema, y una parte de esta estructuración es la
normalización de relaciones. Posteriormente, y debido a aspectos de eficiencia, se puede proceder a
realizar una reestructuración del esquema, parte de la cual supone la desnormalización del mismo.
Esto supone que puede que el esquema resultante de la normalización sea lo suficientemente eficiente
como para que no sea preciso reestructurarlo, o que simplemente no nos interese que el esquema sea
eficiente. Además, puede que normalicemos hasta un cierto nivel, y que solo interese desnormalizar
hasta otro determinado nivel. En definitiva, el proceso de desnormalización supone la unión de varias
relaciones en un número menor de ellas, es decir, a medida que disminuya el nivel de normalización,
es frecuente que el número de relaciones disminuya.
Destacar, por último, que interesa tener un nivel fuerte de normalización cuando el número de
actualizaciones sea alto con relación al de consultas, ya que se evitarán las anomalías expuestas. Sin
embargo, si el número de consultas es alto con relación al de actualizaciones, interesará que el nivel de
normalización sea bajo, ya que el diseño será redundante, lo cual implica que se tardará menos en
buscar la información. Como norma general, se procurará que el esquema esté siempre normalizado al
nivel de 3FN.
Por ejemplo, supóngase el ejemplo de los cursos visto en el apartado anterior. Si tenemos que no se
van a realizar prácticamente actualizaciones, si no que se van a realizar consultas sobre los atributos
profesor, domicilio y cod_postal, nos encontramos que para realizarla necesitamos acceder a dos
55
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
tablas (relación 1 y relación 4), es decir, se deberá realizar un join, con el aumento de tiempo de
proceso que ello supone. Por lo tanto, puede interesar en este caso desnormalizar dicho esquema un
nivel, hasta 2FN, donde para acceder a dicha información, simplemente se precisa consultar la relación
1.
Profesor
profesor domicilio
Relación 1 Domicilio profesor
domicilio cod_postal
Cod_postal
Curso
Relación 2 curso precio curso
Precio
Profesor
Profesor, fecha
Relación 3 Fecha
curso
Curso
Tabla 23
56
Diseño físico
Introducción
El diseño físico busca conseguir una instrumentación lo más eficiente posible del esquema lógico,
considerando los aspectos más cercanos al hardware, es decir, los requisitos de procesos,
características del SGBD, del Sistema Operativo y del hardware, pretendiendo los siguientes objetivos:
Como ya se ha comentado, debido a la falta de flexibilidad de los actuales SGBD, es preciso llevar a
cabo a cabo en muchas ocasiones un proceso de reestructuración de relaciones para conseguir una
mayor eficiencia, lo que significa que se debe iterar desde el diseño lógico específico al físico y
viceversa, hasta obtener un esquema aceptable, que optimice el ratio coste / beneficios.
El diseño físico es fuertemente dependiente del producto comercial que se vaya a usar, debido a la
carencia de un modelo formal, equivalente al relacional que permita una definición formal de esa fase
de diseño. Sin embargo, existen características que son comunes a la mayoría de los productos, y que
pueden ser utilizadas para definir un esquema físico.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Se podría considerar el diseño físico como una caja negra, en la que se toman como entradas los
recursos de la máquina, los recursos lógicos (SO, etc.), el esquema lógico obtenido en la fase anterior,
información sobre las aplicaciones que se ejecutarán en la máquina así como los objetivos que se
plantean en esta fase, y se obtienen como salidas una estructura interna, que representa la
implementación del esquema lógico en un hardware específico, junto con unas normas de seguridad y
unas especificaciones para el ajuste, es decir, la forma de iterar entre la etapa de diseño lógico
específico y la fase de diseño físico.
3. Híbrido entre ambos. El SGBD proporciona una estructura interna opcional que el diseñador
puede cambiar con el fin de mejorar la eficiencia. Entre las ventajas que supone utilizar esta
técnica estriba la de que la BD puede empezar a funcionar de inmediato al disponer del
esquema interno opcional, con la posibilidad de ir mejorando sucesivamente la eficiencia al ir
realizando ajustes, a la par que se mantiene la independencia. Destacar que esta es la estrategia
más utilizada en los actuales SGBD.
Los bloques, que se encuentran almacenados en los sectores del disco, deben ser accedidos por el
SGBD utilizando los mecanismos de gestión de ficheros que provee el sistema operativo. El tiempo en
acceder a un sector del disco, que es bastante elevado, está compuesto por varios factores:
• Tiempo de arranque: tiempo que tarda el disco en empezar a mover las cabezas.
• Tiempo de seek: tiempo necesario para mover las cabezas al cilindro (conjunto de pistas del
mismo diámetro) requerido.
• Tiempo de latencia: tiempo que debe esperar hasta que el sector para por debajo de las
cabezas.
• Tiempo de transferencia: tiempo necesario para transferir la información, por el bus de datos,
a memoria principal.
58
© Grupo EIDOS 5. Diseño físico
Para acelerar este proceso, se suele usar un dispositivo de almacenamiento intermedio, denominado
caché o buffer, cuyo cometido es el de almacenar los datos más usados, aprovechando de este modo
la ley de proximidad temporal, es decir, los datos que han sido usados más recientemente, tienen una
alta probabilidad de que sean usados en un futuro cercano, evitando de este modo accesos extra a
disco. Este dispositivo es gestionado por el sistema operativo, utilizando diversas políticas, entre la
que la más usada es la LRU (Least Recently Used), es decir, los bloques que se han usado hace más
tiempo, son candidatos a desalojar la caché para albergar otros bloques. Otra política es aprovechar la
ley de proximidad referencial, es decir, los datos próximos tienen mayor probabilidad de ser
referenciados.
Algunos SGBD permiten especificar las características de los registros físicos. Se pueden agrupar
determinado número de bloques contiguos en unidades llamadas extensiones. Los parámetros que se
pueden especificar son:
• El porcentaje de espacio libre que se deja en cada bloque para albergar posteriores
actualizaciones de los registros lógicos. Al modificar un valor de un atributo, puede que éste
no quepa en el espacio reservado. De esta forma se evita la concatenación de bloques, que
incide en un menor tiempo de respuesta.
Organización de ficheros
Existen varias formas de organizar los ficheros, de forma que el acceso a los mismos se realice de una
y otra forma:
• Hash: Es una forma de organizar los ficheros teniendo como base una tabla indexada que
apunta a la información. Es útil cuando las filas se recuperan por el valor de la clave, que en
este caso actúa como función para determinar la posición donde se encuentra la información.
• ISAM: Es una opción más amplia que la anterior, ya que soporta búsquedas por valores de
clave, además de por parte de ella o usando patrones de búsqueda.
• Árbol B+: Es una estructura que soporta búsquedas dicotómicas (el número de búsquedas es
menor que log2 n). La ventaja con respecto al caso anterior es que crece de forma dinámica.
• Índices: Se puede definir un índice como una estructura que sirve para mejorar la eficiencia de
las consultas a una base de datos. Un índice se define sobre uno o varios atributos. A la hora
de acceder a dichos atributos, el tiempo de acceso será instantáneo. Un índice se puede
59
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Tabla 24
Si en este momento se desea hacer una consulta sobre todos los jugadores que se llamen
Fernando, se deberá acceder a todas las filas, encontrándose dos jugadores que cumplen este
requisito, es decir, se han realizado siete accesos. Sin embargo, si se dispone de un índice por
el atributo Nombre, los accesos serían inmediatos a las dos únicas filas que cumplen este
requisito, reduciéndose en este caso el número de accesos a dos. Si ahora se desea buscar
todas las filas con el nombre de Rafael, y que pertenezcan al Deportivo, se realizarían siete
accesos (toda la tabla). Si tuviésemos un índice por el atributo Nombre, se encontraría una
única fila, pero se debería acceder a dos, es decir, las filas cuyo nombre es Rafael. Sin
embargo si tuviésemos un índice combinado para los atributos Nombre y Equipo, solo se
realizaría un acceso, la de nombre Rafael y equipo Deportivo.
Ya se ha visto entonces la ventaja de usar este tipo de estructuras para acceder rápidamente a
la información. Sin embargo no todo son ventajas, ya que cuanto mayor sea esta estructura,
mayor espacio de almacenamiento será necesario, sin contar el tiempo que se pierde en
actualizar el índice cuando se modifica algún valor de los atributos que forman parte de él. Por
este motivo, se suele indexar la clave primaria (mediante un índice único, es decir, que no
permita valores repetidos), o aquellos atributos que no vayan a ser modificados. La siguiente
lista resume una serie de consejos a la hora de indexar campos:
• Indexar las claves ajenas, es decir los atributos de una tabla que son clave que otras tablas
• Indexar aquellos atributos que se van a consultar con más frecuencia, y que no van a ser
alterados
60
© Grupo EIDOS 5. Diseño físico
Figura 35
Con este método se consigue mejorar la eficiencia en la consulta simultanea de ambas tablas, pero
empeora cuando se recorren de forma separada.
• Compresión de datos: Por un lado, la compresión de datos permite reducir el espacio
requerido para almacenar la información, lo que radica en un menor número de operaciones de
Entrada / salida. Sin embargo, se requiere un mayor tiempo de proceso debido a la necesidad
de descomprimir los datos que se recuperan.
61
Introducción a SQL Server
¿Por qué se llama SQL Server?. Pues bien, se llama SQL porque utiliza este lenguaje para la
definición y manejo de los datos, y se llama Server porque dispone de una parte servidora que se
encarga de atender a los procesos clientes, que son los que realizan las peticiones a éste; es decir, sigue
una arquitectura cliente/servidor.
SQL Server utiliza una extensión al SQL estándar, que se denomina Transact SQL. Esto quiere decir
que soporta el SQL de ANSI, pero además se le han añadido ciertas funciones adicionales, no
contempladas en el estándar, y que son específicas para este producto, es decir, si ejecutamos una
sentencia del conjunto adicional (Transact SQL) en otro SGBRD, éste no la entendería.
El Transact SQL, soporta la definición, modificación y eliminación de bases de datos, tablas, atributos,
índices, etc., es decir, el lenguaje de definición de datos (DDL), así como la consulta, actualización y
borrado de tuplas de tablas, es decir, el lenguaje de manipulación de datos (DML).
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Orígenes
Como podemos comprobar, el mercado de la informática ha ido cambiando sorprendentemente desde
hace unos pocos años. Cuando surgió aquella maquina que hoy denominamos PC, nadie podía
imaginar que iba a desbancar de su puesto a las grandes plataformas como el Sistema 36 de IBM o el
VAX de Digital.
Por aquel entonces, principios de los ochenta, empezaban a implantarse las bases de datos
relacionales, sobre todo con ORACLE, pero ni por asomo podían ser utilizadas en los PCs. ORACLE
fue el nombre que se le dio a un proyecto, destinado a investigar el modelo relacional, por aquel
entonces algo utópico. Sin embargo, ante la falta de resultados positivos, se decidió cancelar el
proyecto, y venderlo a Relational Software Inc. (RSI). En 1979, RSI lanzó al mercado la versión 2 de
ORACLE, que fue la primera base de datos relacional en utilizar el lenguaje SQL. Fue un poco más
tarde cuando RSI decidió cambiar su nombre por el de su producto estrella, ORACLE. Sin embargo, la
aparición de dBase, de Ashton-Tate, supuso una revolución en el mundo de las bases de datos para PC,
originando una batalla para ganar posiciones en este mercado.
En el año 1988, ante el boom del PC, Ashton-Tate, IBM, Microsoft y Sybase, deciden aliarse para
sacar un nuevo producto al mercado: una base de datos relacional, para PC. Este hecho supuso el
nacimiento de SQL-Server. A su vez, IBM y Microsoft se comprometieron a desarrollar un nuevo
entorno, dirigido a las bases de datos, capaz de soportar SQL-Server, y le dieron el nombre de OS/2.
A su vez, SQL Server fue avanzando, adaptándose a las nuevas tendencias del mercado. Fue entonces
cuando la aparición de Windows NT reemplazó a OS/2 como soporte para SQL Server. Desde
entonces y hasta hoy, los SGBD relacionales más vendidos resultan ser ORACLE y SQL Server.
El interfaz de acceso a bases de datos por excelencia, ha sido siempre ODBC, que significa Open
Database Connection (Conexión abierta a Bases de Datos), y que supone la abstracción por parte del
usuario que quiere acceder a la base de datos, que no tiene por qué saber las características de ésta.
ODBC ofrece una serie de métodos encapsulados, los cuales hacen todo el trabajo de traducción.
Sin embargo, otra forma de acceder a una base de datos desde Internet es la ofrecida por un producto
llamado Microsoft Internet Information Server (IIS). La combinación de éste con SQL Server, ofrece
una potente forma de unir SQL e Internet. Mediante esta forma, se pueden mostrar datos en un
navegador de Internet, obtenidos de una base de datos SQL, por ejemplo.
64
Lo nuevo en SQL-Server 2000
Introducción
Como decíamos, SQL-Server ha ido evolucionando a lo largo de los últimos años. La apuesta de
Microsoft por este SGBD ha sido (y es) bastante fuerte, lo cual ha hecho posible la mejora y
adaptación del mismo, sobre todo al entorno remoto y distribuido. La Figura 36 muestra la
arquitectura general de este SGBD.
Veremos en este capítulo las mejoras que ha sufrido esta nueva versión, con respecto a las anteriores,
mejoras que pasamos a detallar a continuación.
Nuevas características
Entre las nuevas características que ofrece SQL-Server 2000, cabe destacar las siguientes:
• Funciones de usuario.
• Indexación de vistas.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• Nuevos triggers.
Figura 36
Su sintaxis es similar a la que nos ofrece el HTML, es decir, un conjunto de etiquetas que definen la
estructura de los datos. El Código fuente 2 define un posible formato de intercambio.
<cliente>
<nombre>Pepe</nombre>
<apellidos>Lopez</apellidos>
<telefono>912345678</telefono>
</cliente>
Código fuente 2
66
© Grupo EIDOS 7. Lo nuevo de SQL - Server 2000
SQL-Server 2000 ofrece la posibilidad de devolver un conjunto de resultados utilizando para ello este
tipo de formato, facilitando así el intercambio de datos.
Del mismo modo, se pueden definir vistas distribuidas que accedan a estos datos, en cada uno de los
servidores que nos interese, de manera que la ejecución de la misma dé la impresión de estar
interactuando sobre un conjunto completo de resultados.
Funciones de usuario
Una funcionalidad nueva que aparece en esta versión del SGBD es la de permitir al usuario definir sus
propias funciones. De esta forma se pueden definir funciones que oculten parte de la complejidad que
puede entrañar una consulta, no sólo para la posterior reutilización de la misma, sino también teniendo
en cuenta la abstracción para otros programadores que puedan precisar su uso.
Indexación de vistas
Esta funcionalidad permite optimizar la ejecución de vistas que actúan sobre la base de datos, creando
índices sobre los resultados de ejecución de la misma, que son almacenados en la base de datos. El
usuario no debe preocuparse de la actualización de los datos, sino que éstos son indexados
automáticamente cada vez que se actualicen.
67
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Nuevos triggers
Un trigger o desencadenador es un código especial que se ejecuta cuando se cumple una determinada
condición, como por ejemplo al modificar o borrar datos (se verá en detalle en un capítulo posterior).
SQL-Server 2000 soporta dos nuevos tipos de triggers, que son INSTEAD OF y que sustituye el
comportamiento de ciertos comandos, como por ejemplo insert, update o delete, y AFTER, que se
ejecuta una vez concluida la acción que lo ha desencadenado.
68
Instalación de SQL Server 2000
En este capítulo, veremos como instalar SQL Server 2000, y las distintas opciones que plantea. Para
empezar, introduzca el CD-ROM que contiene el programa. Si no arranca automáticamente, utilice el
explorador para ejecutar el fichero autorun contenido en el CD-ROM. Tenemos dos opciones, la
standard o la personal. La primera de ellas realiza una instalación completa, incluyendo los
componentes servidor, mientras que la segunda es útil en el caso de que no dispongamos de un
servidor. La primera pantalla que aparece es la que se muestra en la Figura 37.
Figura 37
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Para proseguir la instalación, pulsamos la opción SQL Server 2000 Components, apareciéndonos la
pantalla que muestra la Figura 38.
Figura 38
Figura 39
70
© Grupo EIDOS 8. Instalación de SQL - Server 2000
En este caso, puesto que queremos instalar los componentes cliente en nuestro equipo local, sólo nos
permite la selección de esta opción. Si pulsamos el botón Next, visualizaremos la siguiente pantalla
que muestra la Figura 40
Figura 40
Nuevamente, al estar instalando la versión standard en un equipo con Windows 98, sólo se nos
permite seleccionar la opción de crear una nueva instancia de SQL Server. Pulsando el botón Next,
obtendremos la pantalla que se muestra en la Figura 41, donde se nos insta a poner nuestro
nombre y compañía.
Figura 41
71
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Si pulsamos nuevamente el botón Next, podremos visualizar la pantalla que se muestra en la Figura 42,
cuyo cometido es el de mostrarnos las condiciones de uso de la licencia; pulsamos Yes para pasar a la
siguiente pantalla que se indica en la Figura 43.
Figura 42
Figura 43
72
© Grupo EIDOS 8. Instalación de SQL - Server 2000
Figura 44
Dejamos marcados los que vienen por defecto y pulsamos el botón Next, para acceder a la página de la
Figura 45, tras la cual el sistema empezará a instalar los componentes seleccionados y, tras unos
minutos, mostrará la pantalla final en la cual se nos informa de la conclusión del proceso de
instalación, como muestra la Figura 46.
Figura 45
73
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 46
74
El modelo E/R en SQL-SERVER 2000
Introducción
SQL-Server nos ofrece una herramienta para realizar diseños relacionales, pero no a nivel conceptual,
sino a nivel lógico, es decir, tal y como se plasmarían las relaciones en tablas, pudiendo además
especificar cuestiones como la integridad referencial, las restricciones, etc.
Para acceder a esta herramienta, deberemos acceder a la opción del Administrador corporativo o
Enterprise manager.
Una vez dentro, daremos de alta el registro de servidor (si no se encuentra ya hecho), y accederemos a
la opción Diagramas (Diagrams) de la base de datos deseada dentro del grupo Bases de datos
(Databases), como muestra la Figura 47.
En la parte derecha podremos observar como aparecen todos los diagramas disponibles para la base de
datos seleccionada.
Para acceder a uno de ellos, bastará con hacer doble click con el ratón sobre el, mientras que para crear
uno nuevo, seleccionaremos la opción New Database Diagram del menú contextual que aparece al
hacer click con el botón derecho del ratón sobre esta pantalla, como muestra la Figura 48.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 47
Figura 48
76
© Grupo EIDOS 9. El modelo E/R en Sql-Server 2000
Figura 49
Figura 50
77
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
En la parte izquierda nos aparecen todas las tablas disponibles, mientras que en la derecha tenemos las
tablas que nosotros seleccionaremos para pasar a formar parte de nuestro diagrama. La forma de
añadir una tabla al diagrama es seleccionándola y pulsando el botón Add, mientras que para eliminarla
del mismo, como el lector ya habrá podido adivinar, habremos de pulsar el botón Remove.
La caja de selección que aparece en la parte inferior bajo el nombre Add related tables automatically
permite añadir todas las tablas relacionadas con las seleccionadas de manera automática, pudiendo
además especificar el número de niveles que se incluirán, es decir, tablas relacionadas de tablas
relacionadas. Esta opción es muy útil para chequear restricciones de una tabla que no sabemos con
cuales se relaciona.
Una vez seleccionadas todas la tablas que deseamos pasen a formar parte del diagrama (en nuestro
caso escogemos las tablas authors, titleauthor y titles), pulsamos el botón Siguiente para avanzar al
próximo paso, que se muestra en la Figura 51.
Figura 51
Este es el último paso, en el que se nos muestran las tablas que hemos seleccionado. Pulsamos el botón
Finalizar, y ya tenemos nuestro diagrama, que tendrá un aspecto similar al mostrado en la Figura 52.
En el podemos observar las tablas que hemos seleccionado, junto con el nombre de sus atributos, las
claves (que aparecen con un icono en forma de llave), y las relaciones entre ellas. Estas relaciones
muestran las dependencias existentes entre ellas.
Vamos a guardar nuestro diagrama, para trabajar posteriormente con el, pulsando el icono en forma de
disco de la barra de herramientas, y dándole un nombre coherente.
78
© Grupo EIDOS 9. El modelo E/R en Sql-Server 2000
Figura 52
Para visualizar este tipo de características, pulsamos con el botón derecho del ratón en la opción
Propiedades (Properties) del menú contextual, dentro de la tabla o relación deseada, apareciéndonos
una pantalla similar a la de la Figura 53.
Sin embargo, para establecer este tipo de reglas, existe otra manera mucho más cómoda, que es
seleccionar con el ratón el atributo que es clave ajena dentro de una tabla y, sin soltarlo, arrastrarlo
hasta la tabla que contiene la clave primaria con la cual se relaciona.
En la pestaña Indexes/Keys es donde se especifican aspectos referentes a los índices que van a hacer
referencia a los atributos de la tabla, y cuyo aspecto es el mostrado en la Figura 54.
79
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 53
Figura 54
80
© Grupo EIDOS 9. El modelo E/R en Sql-Server 2000
En esta pantalla podemos crear o borrar índices, definidos sobre uno o varios atributos, de tipo
ascendente o descendente (se refiere a la ordenación). El índice primario hará referencia a la clave
primaria de la relación, aunque también podemos especificar otro tipo de índices, como de tipo único,
cluster, etc.
Dentro de la pestaña Check Constraints podemos indicar las restricciones sobre los atributos de la
tabla. Por ejemplo, en la Figura 55 se especifica una restricción sobre el atributo clave de la tabla,
especificando mediante una expresión regular que dicho atributo deberá ser rellenado con 9 dígitos, y
que se aplicará en las replicaciones, inserciones y actualizaciones.
Figura 55
Para ello, nuevamente habrá que escoger la opción correspondiente haciendo click con el botón
derecho del ratón, como muestra la Figura 56.
81
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 56
Otra de las formas de modificar, por ejemplo, el nombre de un atributo, es pulsando sobre el y
escribiendo directamente el nuevo sobre la tabla, o cambiar el tipo haciendo click derecho en el
atributo y escogiendo la opción de propiedades, y escoger la pestaña Columns.
Una vez que aparezca la tabla seleccionada en el diagrama, vamos a añadir la relación con una
existente. Para ello pulsamos con el ratón el atributo stor_id en la tabla authors y, sin soltarlo, nos
movemos a la tabla stores. Ya tenemos la relación entre ambas tablas, sólo tendremos que confirmarlo
ante la pantalla que nos aparece en la Figura 58. El diagrama resultante es el mostrado en la Figura 59.
Si hacemos click derecho y escogemos la opción propiedades sobre la nueva relación creada, podemos
observar las restricciones y las reglas de integridad aplicables a la misma, mostradas en la Figura 60
Figura 57
82
© Grupo EIDOS 9. El modelo E/R en Sql-Server 2000
Figura 58
Figura 59
83
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 60
84
El analizador de consultas
Introducción
El analizador de consultas (o query analizer) es la herramienta que permite editar y ejecutar sentencias
de T-SQL. Su apariencia es la que muestra la Figura 61.
Podemos observar en ella un editor, que sirve para ejecutar las sentencias, una barra de menú, con las
opciones disponibles, y una barra de herramientas con iconos de acceso rápido a ciertas utilidades.
• Disconnect all: Idem que el anterior, pero para todas las conexiones abiertas
• Save as: Idem que el anterior, pero con la posibilidad de indicar un nombre de archivo.
• Save all queries: Idem que el anterior, pero para todas las ventanas abiertas en el editor.
• Recent file list: Muestra una lista con los archivos más recientemente usados.
Figura 61
Figura 62
86
© Grupo EIDOS 10. El analizador de consultas
• Undo: Deshace el último cambio realizado en el texto de la ventana en uso del editor.
• Repeat last find: Idem que el anterior, pero para buscar varias coincidencias.
• Replace: Reemplaza un texto por otro, dentro de la ventana en uso del editor.
• Go to line: Mueve el cursor a una línea determinada, dentro de la ventana en uso del editor.
• Bookmarks: Permite manejar los bookmarks, o marcas dentro del texto de las sentencias a
ejecutar, para su mejor identificación.
• Insert template: permite añadir una plantilla de una sentencias, muy util para sentencias
repetitivas. Además SQL-Server nos ofrece plantillas predeterminadas, para cada uno de los
casos más representativos (creación de vistas, procedimientos almacenados, etc.), ahorrando al
programador la mayor parte del trabajo.
• Replace template parameters: Permite al usuario cambiar los parámetros dentro de una
plantilla, es dccir, rellenarla con las tablas, campos, etc. que se ajusten a sus necesidades.
Figura 63
87
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Dentro del menú Query nos encontramos con las opciones disponibles, relacionadas con la edición y
ejecución de consultas:
• Change Database: Permite cambiar la actual conexión a una base de datos por otra.
• Cancel executing query: En el caso de que se esté ejecutando una consulta, permite
detenerla.
• Display estimated execution plan: Muestra el plan previsto, desglosando en pasos cómo se
ejecutará la consulta. La Figura 65 indica un posible plan de ejecución para una consulta
concreta.
• Index tunning wizard: Permite realizar el ajuste o “tunning” (cuyo concepto ya ha sido visto
en los primeros capítulos) de los índices de una base de datos concreta. En particular, esta
opción arranca un asistente para realizarlo.
• Results in text: Si está marcada esta opción, los resultados de la consulta serán mostrados en
formato textual.
• Results in grid: Si está marcada esta opción, los resultados de la consulta serán mostrados en
una rejilla o grid, separados por filas y columnas.
• Results to file: Si está marcada esta opción, los resultados de la consultas serán enviados a un
archivo.
• Show execution plan: Si esta opción esta marcada, se muestra el plan de ejecución de la
consulta, una vez realizada. Si la opción display estimated execution plan nos enseñaba el plan
estimado, esta opción muestra, junto con los resultados, el plan real de ejecución de ésta.
• Show server trace: Si esta opción está marcada, se muestra información acerca de la traza de
ejecución de la consulta en el servidor, es decir, pasos de la ejecución, consumo de
procesador, número de lecturas/escrituras, etc. La Figura 66 muestra una posible traza de
ejecución en el servidor de una sentencia select de ejemplo.
• Show client statistics: Si esta opción está marcada, se muestran estadísticas de ejecución de la
consulta, vista desde la parte cliente. Una posible estadística es la mostrada en la Figura 67.
Por su parte, la opción de menú Tools muestra opciones referentes a herramientas que se pueden usar
para configurar diversas opciones referentes al editor o ejecución de consultas.
La opción Window permite manejar las ventanas que se encuentran dentro del editor, para colocarlas
en cascada, en mosaico, navegar entre ellas, etc.
Por último la opción Help ofrece una completa ayuda tanto del editor, como cuestiones diversas sobre
T-SQL.
88
© Grupo EIDOS 10. El analizador de consultas
Figura 64
Figura 65
89
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 66
Figura 67
90
© Grupo EIDOS 10. El analizador de consultas
La barra de herramientas
Crea un nueva consulta, pudiendo utilizar para ello una plantilla.
Ejecuta la consulta.
91
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 68
Una vez hecho esto, ya tenemos acceso a todas las bases de datos existentes en el servidor. Escogemos
una de ellas, por ejemplo pubs, y dentro del editor tecleamos el Código fuente 3, cuyo cometido es
mostrar todos los valores de todos los atributos de la tabla titles.
Código fuente 3
En ella podemos apreciar como se nos ha dividido el editor en dos partes. La de arriba contiene la
sentencia a ejecutar, mientras que la de abajo muestra los resultados de la ejecución de la misma.
Probemos ahora a mostrar los resultados en forma de tabla. Para ello seleccionamos la opción Results
in grid del menú Query. Ejecutamos nuevamente, y lo que nos aparece ahora es una ventana como la
que muestra la Figura 70.
92
© Grupo EIDOS 10. El analizador de consultas
Figura 69
Figura 70
En ella podemos observar como lo que antes nos aparecía en forma de texto, ahora nos aparece en un
grid, con una salvedad, el mensaje que indicaba el número de registros devueltos aparece ahora en otra
pestaña en la parte inferior, nombrada como Messages. Esta pestaña no sólo sirve para visualizar el
93
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
número de registros seleccionados, sino muestra otro tipo de mensajes, como por ejemplo los de error,
tal como se puede observar en la Figura 71.
Figura 71
Por último, guardaremos nuestra pequeña consulta en un archivo, para lo cual seleccionaremos la
opción Save as del menú File, y escogiendo un nombre para el mismo, como muestra la Figura 72.
Figura 72
94
© Grupo EIDOS 10. El analizador de consultas
Otra de las posibilidades que nos ofrece SQL-Server es la de exportar los datos que hayamos obtenido
en una consulta. Para ello, y estando en el modo de Results in grid, seleccionamos con el ratón el
rango de resultados que deseemos exportar y hacemos clic con el botón derecho del ratón para
seleccionar la opción Save as. Nos aparecerá una ventana como la de la Figura 73, en la que
deberemos dar un nombre al archivo, y la forma de exportación y separación de campos.
Figura 73
95
El lenguaje de definición de datos (DDL)
Introducción
Como ya se vio en la anterior parte acerca del diseño de esquemas relacionales, existen dos tipos de
sentencias, con diferente cometido, que permiten mantener dicho esquema:
• Lenguaje de Manipulación de Datos (DML): permite manipular los datos del esquema
relacional, es decir, consultar, actualizar, o borrar información.
En este capítulo se verá este último, dejando el primero para otro posterior. Si el lector encuentra
alguna terminología un tanto desconocida, no se preocupe, ya que en un próximo capítulo se
describirán con detalle los operadores básicos que ofrece Transact SQL, así como algunas
consideraciones acerca del lenguaje.
Tipos de datos
Existe una amplia variedad de tipos de datos que podemos utilizar en Transact SQL. Estos tipos de
datos serán utilizados a la hora de definir los atributos de una tabla. La Tabla 25 muestra una
descripción de éstos.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
98
© Grupo EIDOS 11. El lenguaje de definición de datos (DDL)
Tabla 25
Creación de tablas
Una de las principales sentencias de definición de datos es la de creación de una tabla. Su sintaxis es la
siguiente:
La ejecución de esta sentencia, genera como resultado una nueva tabla, en la base de datos en la que
estemos conectados. El nombre de la tabla debe ir después de la palabra TABLE. El nombre de los
99
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
atributos deberá ir entre paréntesis, especificando el tipo. Si existe más de un atributo, se deberán
separar por comas.
Otra opción nos permite cargar un número de filas de otra tabla, cargando su estructura. La sentencia
encargada de esto la vemos en el Código fuente 4.
Código fuente 4
La anterior sentencia, lo que haría sería volcar el contenido de la tabla tabla2 en la tabla tabla1. Sin
embargo, para poder utilizar esta opción, es necesario modificar un parámetro de SQL Server. Para
ello, deberemos ejecutar el Código fuente 5.
Código fuente 5
Modificación de tablas
Entendemos por modificar una tabla, cambiar su estructura, es decir, añadir atributos, borrarlos, o
cambiar la definición. La sentencia que permite modificar una tabla es la que muestra el Código fuente
6.
Código fuente 6
Nótese que el nuevo atributo añadido debe ser de tipo NULL, ya que si no se permiten valores nulos,
se produciría un error, al crearse los campos de la tabla con este valor.
Por ejemplo, si queremos añadir un atributo atributo1 de tipo varchar(30), a la tabla tabla1, deberíamos
ejecutar el Código fuente 7.
Código fuente 7
Sólo pueden modificar las tablas el administrador, el propietario de la base de datos, y el propietario
de la tabla.
100
© Grupo EIDOS 11. El lenguaje de definición de datos (DDL)
Borrado de tablas
La sentencia que borra una tabla aparece en el Código fuente 8.
Código fuente 8
Para poder borrar una tabla, ésta no debe estar siendo usada. En este caso deberemos hacer un
SELECT de otra tabla para liberarla. Además sólo podrá borrar una tabla el administrador, o el
propietario de la misma.
Código fuente 9
Esta sentencia permite añadir una clave primaria en tabla, por los campos cod1 y cod2.
Para crear un índice en la tabla todos, denominado Código, por el campo cod_cliente, se debe
especificar el Código fuente 10.
Código fuente 10
Sí además queremos que el índice no admita valores nulos, se debe ejecutar el Código fuente 11.
Código fuente 11
101
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
La sentencia que se encarga de borrar un índice, se muestra en el Código fuente 12. Esta sentencia se
encarga de borrar el índice código creado anteriormente.
Código fuente 12
102
Ejemplos prácticos de uso del DDL
Introducción
Se verán en este capítulo una serie de ejemplos para poner en práctica los conceptos aprendidos en el
anterior, para afianzar al lector en el uso del lenguaje de definición de datos, plasmado en el
analizador de consultas de SQL-Server 2000. Además, la definición de estos esquemas nos servirá
como base para utilizar el lenguaje de manipulación de datos en próximos capítulos.
Código fuente 13
Por ejemplo, se procederá a continuación a crear una tabla destinada a contener información acerca de
las ofertas disponibles en una agencia inmobiliaria. Interesará almacenar por cada una de las ofertas la
siguiente información: un código de identificación, la provincia y el domicilio donde se encuentra, el
tipo de bien inmueble al que pertenece, si se encuentra en venta o alquiler y el precio del mismo. La
sentencia SQL que nos permite crear esta tabla se muestra en el Código fuente 14:
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Código fuente 14
Sin embargo, la tabla que hemos creado más arriba puede dar problemas, ya que no esta normalizada;
por ejemplo, no podremos crear un tipo de bien inmueble nuevo hasta que no dispongamos de un bien
con esas características. Por lo tanto procederemos a crear una tabla para los tipos de bienes y otra
para las provincias (que a su vez se relacionará con una tabla de comunidades autónomas). Para ello
primero borramos el esquema creado anteriormente, utilizando la sentencia drop table (aprenderemos
como modificar un esquema en el siguiente epígrafe). El diagrama de la Figura 74 mostraría el
esquema resultante, y el Código fuente 15 las sentencias a ejecutar para conseguirlo.
Figura 74
104
© Grupo EIDOS 12. Ejemplos prácticos de uso del DLL
Código fuente 15
Supongamos ahora que se desea tener constancia de los datos personales de los comerciales que
trabajan en dicha agencia, necesitando almacenar, para cada uno de ellos, la siguiente información:
NIF (que de momento hará las veces de clave primaria de la tabla), nombre y apellidos, dirección,
código postal, provincia, teléfono y categoría, como muestra el Código fuente 16 .
Código fuente 16
Al igual que para los comerciales, se necesitará también conocer los datos personales de los clientes
que están suscritos a nuestra agencia, conociendo por cada uno de ellos su NIF, nombre y apellidos,
dirección, provincia, código postal, teléfono y sus datos bancarios (nos bastará con el CCC de la
cuenta bancaria), siendo en NIF la clave primaria de la tabla, como muestra el Código fuente 17.
105
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
) ON [PRIMARY]
GO
Código fuente 17
Figura 75
Sin embargo, podemos darnos cuenta de que falta una cosa bastante importante para ubicar el
inmueble, y que son los transportes públicos más cercanos de los cuales dispone. Nos podemos
plantear esta información como dos tablas: una de tipos de transporte (por ejemplo metro y cercanías
RENFE) y otra de transportes en sí, que almacenará las estaciones o paradas para cada tipo de los
mencionados (por ejemplo Legazpi y Pacífico para metro y Fanjul y Móstoles para cercanías), como
muestra el diagrama de la Figura 76 y el Código fuente 18.
Código fuente 18
106
© Grupo EIDOS 12. Ejemplos prácticos de uso del DLL
Figura 76
En un momento dado nos puede interesar la posibilidad de tener almacenados en la base de datos
todos los códigos postales, para posibles clasificaciones de inmuebles o futuras estadísticas, así que
daremos también de alta esta tabla, necesitando los siguientes atributos: el código postal (que actuará
como clave primaria de la tabla) y la provincia (ya que una misma provincia dispondrá de distintos
códigos postales, es una relación 1-N, e importa la clave de esta última tabla), como nos indica el
Código fuente 19
Código fuente 19
Código fuente 20
107
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Volviendo sobre el ejemplo de la agencia desarrollado en el anterior epígrafe, podemos darnos cuenta
de varios aspectos del esquema que no son del todo correctos, y que se podrían mejorar.
Así, por ejemplo, los comerciales aparecen desconectados de las ofertas de bienes, por lo que no
mucho sentido, a no ser que sólo nos interesen dichos datos a título informativo. Pero ya que tenemos
esa tabla y, puesto que el modelo relacional es eso, la relación entre tablas, podremos conseguir
información de valor añadido si conectamos la tabla de ofertas a la de comerciales, para de este modo
conocer qué comerciales han intervenido en la compra/alquiler de qué inmuebles. Esto puede ser muy
útil a la hora de calcular comisiones o prever promociones, etc. Para conseguir esta característica
adicional en nuestro esquema, será necesario añadir un atributo más a la tabla de ofertas que la
relacione con el comercial. Esto es así debido a la relación 1-N que existe entre ambas tablas (un
comercial interviene en la transacción de muchos inmuebles, pero un inmueble sólo puede ser
gestionado por un comercial), lo que hace que se importe el atributo clave de la tabla de comerciales
como muestra el diagrama de la Figura 77.
Figura 77
Sin embargo esto nos obliga a modificar el esquema, con objeto de añadir este nuevo atributo a la
tabla de ofertas existente como muestra el Código fuente 21.
Código fuente 21
108
© Grupo EIDOS 12. Ejemplos prácticos de uso del DLL
Sin embargo nos encontramos con un problema, y es que no podemos añadir un nuevo atributo con la
propiedad not null, así que deberemos ejecutar una segunda sentencia, que modifique el atributo
añadido para que no pueda tomar valores nulos (ya que es una clave ajena):
ALTER TABLE [dbo].[Oferta] alter column [Com_NIF] [char] (10) not null
GO
Código fuente 22
Igual que para los comerciales, nos interesaría saber qué clientes han comprado/alquilado qué
inmuebles, para controlar los pagos, enviarles facturas, etc. La conexión entre ambas tablas es similar
al caso anterior. Y al igual que en el anterior caso también, se necesita modificar el esquema de la base
de datos, así que se utilizará, de un modo similar, la sentencia alter table (véase el Código fuente 23).
Código fuente 23
Siguiendo el mismo razonamiento, haremos lo mismo con la tabla de códigos postales. El caso de la
tabla de transportes es algo especial, ya que para un mismo inmueble pueden existir más de una
estación de metro cercana, que a su vez puede estar próxima a otros inmuebles; es un claro ejemplo de
relación N-M. Si recordamos lo que ocurría con este tipo de relaciones, se creaba una tabla intermedia
que importaba las claves de ambas. El Código fuente 24 muestra la forma de hacerlo:
Código fuente 24
Sin embargo esta tabla dispone de una clave primaria compuesta, formada por ambos atributos, así que
se deberá ejecutar el Código fuente 25 para modificar el esquema de forma que se añada una
restricción en forma de clave primaria a dicha tabla:
Código fuente 25
109
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Sin embargo no debemos olvidarnos de un aspecto muy importante, que es el de las claves ajenas y las
restricciones. Deberemos relacionar todas las tablas de manera que se establezca una relación entre las
claves ajenas que unen las relaciones, para no tener problemas de borrar una tupla de una tabla que sea
clave ajena en otra relación, o insertar tipos que no estén dados de alta en las tablas maestras que los
tipifican.
110
© Grupo EIDOS 12. Ejemplos prácticos de uso del DLL
) REFERENCES [dbo].[TipoTransporte] (
[TT_ID]
)
GO
Código fuente 26
Como podemos ver, la forma de introducir claves ajenas en la base de datos es mediante restricciones,
poniendo el nombre de la tabla donde se encuentra el atributo que es clave ajena, seguido de las
palabras foreign key y a continuación las referencias a los atributos que son clave en sus relaciones.
Con todo esto, obtenemos el esquema relacional que se muestra en el diagrama de la Figura 78:
Figura 78
Código fuente 27
111
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Retomando el ejemplo que nos lleva en este capítulo, podemos observar que la tabla de código
postales, de momento, no nos aporta nada, ya que la información que se precisa para un inmueble, no
recoge este dato como algo necesario, por contra, puede dificultarnos la gestión de la base de datos, así
que procederemos a su borrado, como muestra el Código fuente 28:
Código fuente 28
Código fuente 29
Recordemos cual es el cometido de un índice, que no es otro que el de acelerar las consultas que se
realizan sobre una base de datos. Sin embargo, es una decisión del diseñador el establecer los índices
oportunos para que el rendimiento de la misma no se vea afectado, ya que un índice es una estructura
que si bien acelera las consultas, puede llegar a ralentizar las actualizaciones de datos.
Veamos que índices podemos crear en el ejemplo que nos lleva este capítulo. Por ejemplo, podemos
adivinar que la tabla crítica para realizar consultas será la de ofertas. Es más, podemos intuir que la
mayoría de las consultas de dicha tabla involucrarán a los atributos precio y tipo de transacción
(alquiler o venta).
La siguiente decisión es considerar si crear un único índice con estos dos atributos, o crear dos por
separado. Pues bien, depende de las consultas que se vayan a realizar.
Si suponemos que la mayoría de las consultas se realizarán por ambos criterios, convendría crear un
único índice con ambos atributos. Sin embargo y, como será el caso, la mayoría de las consultas se
realizaran por precio o por tipo de transacción, conviene crearlos por separado de la siguiente forma:
Código fuente 30
112
© Grupo EIDOS 12. Ejemplos prácticos de uso del DLL
Código fuente 31
Si en nuestro caso deseáramos borrar el índice oferta2 creado anteriormente, deberíamos ejecutar:
Código fuente 32
La salvedad es que debemos indicar el código del índice de la forma tabla.indice, para evitar
ambigüedades.
113
El lenguaje de manipulación de datos
(DML)
Introducción
Ya se ha visto en un capítulo anterior el lenguaje de definición de datos (DDL), que es el que permite
definir y modificar la estructura de un esquema. Veremos a continuación el otro lenguaje, el de
manipulación de datos, que nos permite, como su propio nombre indica, manejar los datos contenidos
en el esquema.
La sentencia Select
La sentencia Select es una sentencia SQL, que pertenece al conjunto del Lenguaje de Manipulación de
Datos, y que sirve para recuperar registros de una o varias tablas, de una o varias bases de datos. Su
sintaxis es la siguiente:
Donde las mayúsculas representan palabras reservadas, y lo encerrado entre corchetes es opcional,
puede ser omitido. Una vez vista la anterior forma de representación, vamos a detenernos en la sintaxis
de la sentencia Select. Se compone de tres partes:
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• SELECT <atributos>: permite hacer una proyección de las tablas, es decir, seleccionar los
campos que deseamos recuperar de la base de datos, separados por comas. Si se especifica el
símbolo *, se obtendrán todos los campos de la tabla.
• FROM <tablas>: permite especificar la tabla de la cual se desean obtener los datos. Si se
especifica más de una tabla, éstas irán separadas por comas.
• WHERE <condición>: permite establecer una condición de recuperación de las filas de la/s
tabla/s. Sólo se obtendrán aquellas tuplas que verifiquen dicha condición, que será opcional.
En el caso de que se omita esta parte, se recuperarán todas las filas.
• HAVING <condición>: establece una condición para los atributos obtenidos como resultado
de la aplicación de funciones escalares.
En el caso de que se especifiquen varias tablas, en la cláusula FROM, será conveniente denotar los
campos de la cláusula SELECT precedidos por el nombre de la tabla donde se encuentra y un punto,
para que, en el caso de que dicho campo exista en más de una tabla, se sepa en cada momento a cual
de ellos nos estamos refiriendo, evitando en este caso el problema de ambigüedad.
Si por ejemplo, deseamos obtener todos los valores de los atributos title y price de la tabla titles,
deberíamos escribir el Código fuente 33.
Código fuente 33
De esta manera, obtenemos todas las filas, ya que no hemos dado ninguna condición, de la tabla titles
(especificada en la cláusula FROM), de las cuales sólo visualizaremos los valores de los atributos title
y price (especificados en la cláusula SELECT). Si por el contrario, deseamos obtener todos los
atributos de dicha tabla, deberíamos escribir el Código fuente 34.
Código fuente 34
Puesto que hemos especificado el literal * dentro de la cláusula SELECT, la anterior sentencia nos
devuelve todos los atributos de todas las filas de la tabla titles, es decir, nos devuelve toda la
información almacenada en ella.
116
© Grupo EIDOS 13. El lenguaje de manipulación de datos (DML)
La cláusula Where
La forma de usar el Transact SQL para realizar consultas realizando una proyección horizontal (es
decir, seleccionando las filas), es mediante la opción WHERE. A continuación de esta palabra
reservada, se debe especificar la condición lógica que se debe evaluar, para obtener aquellas filas que
la cumplen.
Para expresar una expresión lógica se pueden emplear cualquiera de los operadores de Transact SQL
cuyo resultado devuelva un valor lógico, aunque también se pueden utilizar operadores de cadena.
Estos operadores serán vistos en detalle en el siguiente capítulo, pero básicamente son los siguientes:
• NOT LIKE : compara todas las cadenas que no verifican un patrón de búsqueda
• BETWEEN : compara todas las cadenas que están comprendidas en un rango de valores
Por ejemplo, si queremos obtener los títulos cuyos derechos de autor sean mayores del 10 %,
teclearemos el Código fuente 35. De la misma forma, si queremos obtener todos los títulos cuyo precio
no supere los 2$, ejecutaremos el Código fuente 36.
Código fuente 35
Código fuente 36
Si queremos obtener el nombre de los autores cuya primera letra este comprendida entre la C y la H, y
que a continuación tenga el literal 'urry', ejecutamos el Código fuente 37.
Código fuente 37
117
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
O si queremos obtener la ciudad de todos los autores, que se corresponda con San Francisco o con Salt
Lake City, ejecutaremos el Código fuente 38.
Código fuente 38
Si se desea conocer todos los títulos cuyo precio oscila entre 1 y 2 dólares, ejecutaremos el Código
fuente 39.
Código fuente 39
La cláusula Group by
La cláusula GROUP BY agrupa, como su propio nombre indica, filas que tienen el mismo valor para
un atributo, en grupos distintos. Por ejemplo, si queremos obtener el apellido de todos los autores,
ejecutamos el Código fuente 40.
Código fuente 40
Si nos fijamos en el resultado obtenido, tenemos que existen dos autores, cuyo apellido es el mismo,
Ringer. Por lo tanto, se muestran dos filas iguales para este apellido, una por cada autor que se apellida
Ringer. Supongamos ahora, que lo único que nos interesa es obtener todos los apellidos que sean
distintos. Para ello deberemos agrupar los autores cuyo apellido sea el mismo en un único grupo, y a
continuación mostrar los grupos, en lugar de las filas. Con esto garantizamos que sólo se mostrará una
fila por cada apellido distinto, ya que sólo mostramos una fila del grupo, en lugar de todas. Esto que
parece tan complicado, se resume en una sentencia, usando la cláusula GROUP BY.
Código fuente 41
En ella, lo que se hace es simplemente un select, pero no de las filas de la tabla, sino de los grupos
obtenidos a partir de la cláusula GROUP BY. Puesto que deseamos agrupar por el apellido, detrás de
esta cláusula se debe determinar el atributo au_lname, garantizando así que todas las filas cuyo valor
de este atributo sea igual, irán al mismo grupo.
118
© Grupo EIDOS 13. El lenguaje de manipulación de datos (DML)
La cláusula Having
La cláusula HAVING es similar a la cláusula WHERE, salvo que aquella se usa como condición de
búsqueda cuando se especifica la cláusula GROUP BY. Por lo tanto el funcionamiento es similar al ya
visto para WHERE. La única diferencia es que HAVING se aplica a condiciones de grupo. Por
ejemplo, si dada la anterior sentencia de agrupación, deseamos que sólo se muestre el autor cuyo
apellido sea Ringer, ejecutaremos el Código fuente 42.
Código fuente 42
La cláusula Order by
La cláusula ORDER BY determina el orden de visualización de las filas obtenidas en la sentencia
SELECT. A continuación de dicha palabra reservada, se debe especificar el atributo o los atributos por
los cuales se ordenará el resultado obtenido en la consulta.
Por ejemplo, si queremos mostrar el nombre y apellido de todos los autores de nuestra base de datos
pubs, bastará con ejecutar la sentencia que aparece en el Código fuente 43 donde el atributo
especificado a continuación de la cláusula ORDER BY, es decir, au_lname, determina cómo se
ordenarán las filas que se mostrarán, en este caso alfabéticamente por el apellido.
Código fuente 43
• SUM: Realiza una suma acumulativa de un atributo para todas las filas accedidas mediante
una consulta SQL.
Por ejemplo, supongamos que tenemos una tabla de pedidos, con los atributos cod_cliente,
cod_material y precio. Si queremos obtener la suma del precio de todos los pedidos
almacenados, bastará con realizar una función de tipo SUM, como la que vemos en el Código
fuente 44.
Código fuente 44
119
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
La anterior consulta obtiene la suma del precio para todas las filas de la tabla pedido, ya que
no hemos especificado ninguna condición en la cláusula WHERE.
Si ahora queremos obtener la suma total de todos los pedidos realizados por el cliente cuyo
código es "R12CE", debemos realizar la misma consulta, pero especificando una condición
para obtener únicamente las filas cuyo cod_cliente es "R12CE":
Código fuente 45
• COUNT: Cuenta todas las filas de las tablas accedidas mediante una consulta SQL.
Por ejemplo, si tenemos una tabla cliente, con todos los clientes de una empresa de servicios,
con los atributos DNI, nombre, apellidos, dirección y población, y queremos saber todos los
clientes que tenemos, deberemos realizar un count, para obtener todas el número de filas de la
tabla ejecutamos el Código fuente 46.
Código fuente 46
En el anterior ejemplo, al existir el mismo número de filas, sea cual sea el atributo que
seleccionemos, podríamos haber escogido cualquier otro. En general, se suele escribir el
Código fuente 47.
Código fuente 47
Si ahora queremos saber el número de clientes que viven en Madrid, deberemos realizar un
conteo de todas las filas con la condición de que el atributo población sea Madrid.
Código fuente 48
Si queremos saber cuantos títulos tenemos nuestra base de datos, teclearemos el Código fuente
49.
Código fuente 49
120
© Grupo EIDOS 13. El lenguaje de manipulación de datos (DML)
Código fuente 50
• AVG: Realiza una media aritmética de los atributos para todas las filas accedidas mediante la
consulta SQL.
Si por ejemplo tenemos una tabla de materiales, con los atributos cod_material, descripción,
precio y cantidad_pedida, y queremos saber la cantidad media pedida de todos los materiales,
deberemos realizar una media aritmética, teniendo en cuenta todas las filas de la tabla:
Código fuente 51
La anterior sentencia, internamente, realiza primero una suma de todos los valores, y a
continuación la divide por el número total de filas accedidas, es decir, realiza la media
aritmética.
Volviendo a nuestra cultural base de datos pubs, si queremos saber la media del precio de los
títulos que tenemos disponibles, deberemos ejecutar el Código fuente 52.
Código fuente 52
• MAX: Obtiene el máximo valor del atributo especificado, de entre todas las filas
seleccionadas mediante la sentencia SQL.
Para nuestro ejemplo, si queremos saber cual es el libro más caro, ejecutaremos el Código
fuente 53.
Código fuente 53
121
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• MIN: Obtiene el mínimo valor del atributo especificado, de entre todas las filas seleccionadas
mediante la sentencia SQL. Si queremos saber cual es el libro más barato de nuestra base de
datos, deberemos ejecutar el Código fuente 54.
Código fuente 54
La sentencia Insert
La otra gran sentencia de manipulación de datos es INSERT. Si SELECT nos permitía recuperar
datos, INSERT nos va a permitir añadirlos al esquema, es decir, con esta sentencia podemos añadir
información a la base de datos. Recordemos que estamos en el modelo relacional, por lo que la
información se añadirá a una tabla en forma de filas. Si sólo queremos insertar un valor para un
atributo, el resto de los de la tabla deberá contener el valor nulo (NULL). Sin embargo, habrá ciertas
ocasiones en que esto no será posible, cuando el atributo esté definido como NO NULO, en cuyo caso
deberemos especificar un valor para éste. La sintaxis de este sentencia es:
donde tabla especifica la tabla en la cual se añadirá la fila, atributos es una lista de atributos
separados por comas que determinan los atributos para los cuales se darán valores, y valores
especifica los valores que se darán para estos atributos, separados por comas.
Por ejemplo, si queremos añadir un nuevo autor a nuestra base de datos, deberemos ejecutar el Código
fuente 55.
Código fuente 55
Destacar que si el valor a introducir es alfanumérico, deberá ir encerrado entre comillas, mientras que
si es numérico no. Pues bien, si ejecutamos la anterior sentencia, obtenemos el siguiente error:
La razón es que no hemos dado valor al atributo contract, que ha sido definido como no nulo. Por lo
tanto, rectificamos el Código fuente 55, para dar un valor al Código fuente 56.
Código fuente 56
122
© Grupo EIDOS 13. El lenguaje de manipulación de datos (DML)
El valor que hemos dado al atributo contract es un 1, ya que está definido como tipo binario, es decir,
sólo admite dos valores, 0 para especificar que no está contratado, y 1 para el caso contrario.
(1 row(s) affected)
lo que nos indica que la fila se ha insertado con éxito. Podemos comprobarlo ejecutando un SELECT
sobre dicha fila.
Código fuente 57
La sentencia Update
El objetivo de la sentencia UPDATE es actualizar los valores de una o varias filas de una tabla, sin
necesidad de borrarla e insertarla de nuevo. La sintaxis es la siguiente:
donde tabla especifica la tabla donde se encuentran las filas que queremos actualizar, condición
especifica la condición que se debe cumplir para actualizar las filas, y lo que viene a continuación de
SET especifica la asignación de los nuevos valores a los atributos. Por lo tanto se actualizarán todas
las filas que cumplan la condición especificada. Si queremos cambiar el nombre al autor que hemos
insertado en el anterior apartado, deberemos escribir el Código fuente 58.
Código fuente 58
Lo que hacemos con la anterior sentencia es buscar el autor insertado, por el código (condición
where), y a continuación actualizar el valor del atributo nombre de la fila obtenida a Pepito. Si
ejecutamos la anterior sentencia, obtenemos el resultado: (1 row(s) affected) lo que quiere
decir que la fila ha sido actualizada con éxito. Podemos comprobarlo ejecutando el Código fuente 59.
Código fuente 59
La sentencia Delete
El objeto de la sentencia DELETE es el de borrar filas de una tabla. Para poder borrar filas en una
tabla se deben cumplir las condiciones de seguridad determinadas por el administrador (se verán en un
123
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
próximo capítulo), y deben de cumplirse también las reglas de integridad referencial. La sintaxis es la
siguiente:
donde tabla especifica la tabla sobre la cual queremos borrar las filas, y condición especifica la
condición que se debe cumplir para que se borren las filas. Si omitimos la condición, se borrarán todas
las filas de la tabla, es decir, la sentencia que aparece en el Código fuente 60 borra todas las filas de la
tabla authors.
DELETE authors
Código fuente 60
Por ejemplo, si queremos borrar la fila que hemos creado en la tabla autores, deberemos ejecutar el
Código fuente 61. obteniendo el siguiente resultado: (1 row(s) affected)
Código fuente 61
lo que viene a decir que la fila se ha borrado. Para comprobarlo, ejecutamos la sentencia que muestra
el Código fuente 62. cuyo resultado es: (0 row(s) affected), lo que quiere decir que la fila
no se encuentra en la tabla, es decir, ha sido borrada.
Código fuente 62
124
Operadores básicos y consideraciones
del lenguaje
Introducción
En este capítulo se describirán con detalle los operadores básicos, así como algunas apreciaciones
acerca del lenguaje que ofrece Transact SQL.
Entendemos por operadores, aquellas palabras reservadas o símbolos delimitadores que nos permiten
aplicar las diversas técnicas del álgebra relacional. Las principales que veremos aquí son:
• Proyección
• Unión
• Join o combinación
No confundir los anteriores operadores propios del álgebra relacional, con los que ofrece SQL Server,
es decir, los que permiten la evaluación de expresiones, unión de cadenas, comparaciones lógicas, etc.
Operador proyección
El operador de proyección es muy usado, sobre todo para acotar la consulta de tablas. Dicho operador
consiste en restringir la cantidad de información que obtenemos de una o varias tablas.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Aquí veremos la proyección vertical, es decir, en realizar una criba sobre aquellos atributos que nos
interesen para todas las filas de una tabla, aunque también se puede acotar el resultado de ésta,
especificando una condición, para que el resultado se aplique únicamente a las tuplas que la cumplan.
Veamos ahora como realizar una proyección utilizando Transact SQL. Para especificar los atributos de
la tabla o tablas que deseamos que aparezcan en la consulta, se deberán proporcionar éstos a
continuación de la palabra reservada SELECT, y separados por comas.
Para especificar las tablas sobre las cuales se desea realizar la proyección, se deberán especificar
después de la palabra reservada FROM.
Así, el Código fuente 63 realiza una proyección de los atributos campo1 y campo2 de la tabla tabla1:
Código fuente 63
Código fuente 64
En el anterior ejemplo se ha proyectado sobre dos campos de dos tablas distintas. Para distinguir el
campo1 de tabla1, del campo1 de tabla2, se precede el nombre de la tabla al del campo, seguido por un
punto.
Probemos ahora con el query analyzer. Una vez abierto, nos conectamos a la base de datos pubs,
seleccionándola en la lista desplegable de la parte superior derecha, y tecleamos el Código fuente 65.
Código fuente 65
Nótese como después de cada atributo hemos tecleado otro nombre. A este nombre se le denomina
alias y sirve para que el atributo obtenido aparezca con otro nombre.
Así, en nuestro ejemplo, se recuperarán todas las filas de la tabla titles, y realizaremos una proyección
sobre los atributos title y type, pero como podemos observar en el resultado mostrado en la Figura 79,
dichos atributos aparecen bajo los nombre título y tipo, que son los alias que les hemos dado
respectivamente.
126
© Grupo EIDOS 14. Operadores básicos y consideraciones del lenguaje
Figura 79
Operador Union
El operador unión consiste, como su propio nombre indica, en unir campos de más de una tabla. El
resultado obtenido contendrá entonces campos de las tablas especificadas en la cláusula FROM. Este
operador casi nunca se utiliza por separado, sino junto con el de proyección, para obtener el resultado
consultando en varias tablas, y quedarnos luego sólo con la información relevante. El Código fuente
66 constituye un ejemplo de unión de las tablas tabla1 y tabla2:
Código fuente 66
Otra forma de realizar una unión entre el resultado de dos consultas, es utilizar la palabra reservada
UNION. Por ejemplo, si queremos obtener la unión de las dos consultas a dos tablas, escribiremos el
Código fuente 67.
Pulsamos ahora el botón de ejecución, o F5, y obtenemos el resultado mostrado en la Figura 80, que
no es ni más ni menos, que todas las filas de las tablas titles y titleauthor.
127
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 80
Código fuente 67
Código fuente 68
Operador join
El operador de join es uno de los más usados en el álgebra relacional. Sirve para combinar dos tablas
entre sí, utilizando un atributo común. Lo que se realiza es una unión de cada fila de una tabla, con
todas las filas de la tabla con la que se hace el join, cuyos atributos comunes coincidan.
La forma de realizarlo en Transact SQL es especificando en la cláusula WHERE los atributos por los
cuales se va a realizar el join entre ambas tablas.
Código fuente 69
128
© Grupo EIDOS 14. Operadores básicos y consideraciones del lenguaje
El Código fuente 69 realiza un join entre las tablas tabla1 y tabla2, por el campo1 de ambas tablas.
Veamos un ejemplo de como funciona un join. Supóngase que tenemos las dos siguientes tablas, y
deseamos hacer un join por el atributo campo1 de ambas.
Campo1 Campo2
1 10
2 9
3 4
4 1
Tabla 26
Campo1 Campo2
1 5
1 3
2 8
Tabla 27
Lo primero que se realiza al hacer un join es una unión de ambas tablas, copiando cada fila de la
primera tabla, y para cada fila cuyo campo común sea igual en ambas tablas, copiar las filas de la
segunda tabla.
Por ejemplo, para la primera fila de la Tabla 26, hay dos filas en la Tabla 27 cuyo atributo campo1 es
igual. El join de estas dos tablas queda como muestra la Tabla 28
10 1 1 5
10 1 1 3
9 2 2 8
Tabla 28
Como hemos podido comprobar, la tercera fila de la tabla 1, no aparece en el join. Esto es debido a
que el valor del atributo por el que se hace el join (campo1), cuyo valor es 3, no existe en el atributo
campo1 de la tabla 2. A este tipo de join se le denomina inner join. El otro tipo de join, denominado
outer join, consiste en realizar el join, pero incluyendo todas las filas de ambas tablas, aunque éstas no
tengan correspondencia en su homóloga. Dentro de este tipo de join, existen dos categorías:
129
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• Left join: incluyen todas las filas de la primera tabla, aunque éstas no tengan correspondencia
en la segunda. Los campos de la segunda tabla se rellenan con interrogantes.
10 1 1 5
10 1 1 3
9 2 2 8
4 3 ? ?
Tabla 29
En Trasact SQL, la sentencia para realizar este left join se muestra en el Código fuente 70.
Código fuente 70
• Rigth join: incluyen todas las filas de la segunda tabla, aunque éstas no tengan
correspondencia en la primera. Los campos de la primera tabla se rellenan con interrogantes.
10 1 1 5
10 1 1 3
9 2 2 8
? ? 4 1
Tabla 30
En Trasact SQL, la sentencia para realizar este rigth join aparece en el Código fuente 71.
Código fuente 71
También se puede realizar un join por más de un campo. El Código fuente 72 realiza un join entre las
tablas Tabla 26 y Tabla 27, por los campos comunes campo1 y campo2.
130
© Grupo EIDOS 14. Operadores básicos y consideraciones del lenguaje
Código fuente 72
Código fuente 73
Analicemos la anterior sentencia. Deberemos acceder a la tabla de títulos, que es donde se encuentra el
título de cada obra.
A continuación, realizamos un join de esta tabla, con la tabla intermedia titleauthor, que es la que
almacena el código de cada título, junto con los autores que lo han escrito (recuérdese que en las
relaciones N-M, se genera una tabla intermedia con la clave de cada tabla).
A partir de esta tabla, podemos acceder a los autores, realizando un join de la tabla titleauthor con la
tabla authors, precisamente por el campo au_id, que es el código del autor. Por lo tanto, la cláusula
WHERE realiza los dos join necesarios para acceder a las tres tablas.
Como se puede observar, en la cláusula FROM se deben especificar todas las tablas que serán
accedidas, aunque de éstas no se muestre ningún atributo.
En la cláusula WHERE, además de las condiciones de join, podremos especificar otro tipo de
condiciones.
Por ejemplo, si queremos obtener una relación de todos los títulos cuyo precio no supere los 20 $,
junto con sus autores, ejecutaremos la misma sentencia que antes, pero añadiendo ahora una nueva
condición, que es que el atributo price de la tabla titles no supere los 20$.
Código fuente 74
131
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 81
Figura 82
132
© Grupo EIDOS 14. Operadores básicos y consideraciones del lenguaje
• De nivel de bit: realizan operaciones transformando los operandos a bits. Ej.: AND al nivel de
bit, etc.
• Lógicos: realizan operaciones que devuelven un resultado lógico. Ej.: comparaciones, etc.
La Tabla 31 muestra un resumen de los principales operadores con que nos podemos encontrar en
Transact SQL.
+ Suma SELECT 2 + 4 6
- Resta SELECT 3 - 1 2
Operadores
Aritméticos * Multiplicación SELECT 3 * 2 6
/ División SELECT 6 / 2 3
Módulo o resto de la
% SELECT 4 % 3 1
división entera
OR binario (1 si el bit
11 | 10 = 11 ->
| de alguno de los dos SELECT 3 | 2
3
operandos es 1)
Operadores nivel de bit
OR exclusivo binario
11 ^ 10 = 01 ->
^ (1 si el bit de los SELECT 3 ^ 2
1
operandos es distinto)
Operadores lógicos
133
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Cadenas no
SELECT + FROM
coincidentes. NOT:
tabla WHERE
Operadores de Cadena [^] negación de la J,K,L,M
atributo1 NOT LIKE
expresión LIKE:
'[^I-Z]'
búsqueda por patrón
Tabla 31
• BETWEEN: Verifica los valores comprendidos dentro del rango especificado. La sintaxis es:
Por ejemplo, si queremos obtener todos los títulos cuyo precio oscile entre los 30 y los 50
dólares, escribimos el Código fuente 75.
Código fuente 75
• IN: Verifica si el valor especificado está contenido dentro de una lista de ellos. La sintaxis es:
expresion IN lista
Por ejemplo, si queremos obtener el nombre de todos los autores que vivan en San Francisco o
en Salt Lake City, ejecutamos el Código fuente 76.
134
© Grupo EIDOS 14. Operadores básicos y consideraciones del lenguaje
Código fuente 76
También se puede especificar como lista, el resultado de otra consulta. Por ejemplo, si
queremos obtener el nombre de los autores, que viven en ciudades pertenecientes al estado de
California (CA), escribimos el Código fuente 77.
Código fuente 77
En la anterior consulta, la forma de evaluación es desde dentro hacia fuera, es decir, primero
se evalúa la sentencia que está entre paréntesis, y luego se aplica el valor obtenido para la
evaluación del operador IN.
Variables globales
Existe un conjunto de variables globales, que informan en cada momento del estado del sistema, o del
resultado de una consulta, etc. Esta variables se pueden distinguir porque comienzan por dos arrobas
@@. La Tabla 32 muestra un resumen con las variables globales que nos pueden resultar de utilidad:
@@idle número de ticks de tiempo ocioso de CPU desde que se ejecutó SQL Server
135
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
@@lock_timeout tiempo de time-out (tiempo hasta el cual se intenta dar por válida la
transacción) en milisegundos para bloqueo
@@max_precision nivel de precisión usado por los tipos de datos decimal y numeric
@@pack_received número de paquetes recibidos por SQL Server desde que se inicializó
@@pack_sent número de paquetes enviados por SQL Server desde que se inicializó
@@total_errors número total de errores producidos desde que se inicializó SQL Server
@@version versión, fecha y tipo de procesador actualmente en uso para SQL Server
Tabla 32
136
© Grupo EIDOS 14. Operadores básicos y consideraciones del lenguaje
Sentencias condicionales
Las sentencias condicionales son aquellas que permiten discriminar entre diversas sentencias, según se
cumpla el valor de una expresión lógica. Existen dos tipos de sentencias condicionales. La primera de
ellas tiene la siguiente sintaxis:
IF expresion_logica
sentencia1
[ELSE sentencia2]
Código fuente 78
En definitiva, la sentencia SELECT title FROM titles sólo se ejecuta cuando se cumple la condición
(SELECT count(*) FROM titles) > 10. En otro caso, se ejecutará la rama ELSE, que devuelve el
número de títulos almacenados en la tabla titles.
Otra forma de ejecutar sentencias de forma condicional, corresponde a la sentencia CASE. La sintaxis
es la siguiente:
CASE expresion1
WHEN expresion2 THEN resultado1
WHEN expresion3 THEN resultado2
...
[ELSE resultado3]
Por ejemplo, si queremos saber el nombre de los estados de los autores, en lugar de las iniciales,
podemos ejecutar el Código fuente 79.
137
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
END
FROM authors
Código fuente 79
En este caso se comprueba el valor del atributo state, y si este es igual a CA, se devolverá California,
si es OR se devolverá Oregon, y en otro caso se devolverá el literal 'Otro'.
Sentencias iterativas
Una sentencia iterativa es aquella que permite ejecutar una o varias sentencias de manera repetida,
mientras se cumpla una condición lógica. La sentencia que permite realizarlo es WHILE, y su sintaxis
WHILE expresion_logica
sentencia
[BREAK]
[CONTINUE]
138
La sentencia INSERT
Introducción
La sentencia insert permite la introducción de nuevos registros dentro de un esquema. Su sintaxis, que
ya se ha visto, especifica el nombre de una tabla, los atributos que se van a insertar, y los valores para
dichos atributos. Si insertamos un valor nulo para un atributo que no acepta ese tipo de valores, o si no
especificamos un valor concreto para este tipo de columnas, se producirá un error y la fila no será
insertada.
Sintaxis
La sintaxis de la sentencia insert es la siguiente
donde <atributos> es una lista de atributos separados por comas, y <valores> es una lista de valores
separados por comas. Existe una correspondencia unívoca entre los atributos y los valores, es decir, al
atributo especificado en primer lugar se le asignará el valor indicado en primer lugar, y así
sucesivamente. La palabra reservada INTO es opcional y se puede omitir en la sentencia.
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Ejemplos
Para comenzar veremos un ejemplo sencillo de inserción de tuplas en la tabla del ejemplo de la
agencia inmobiliaria que venimos manejando. Insertaremos dos Comunidades Autonomas en la tabla
de comunidades, como indica el Código fuente 80.
Código fuente 80
Figura 83
Para ver si efectivamente se han insertado ambos registros, ejecutamos una sentencia select como
muestra el Código fuente 81 (véase la Figura 83).
SELECT *
FROM ComunidadAutonoma
Código fuente 81
140
© Grupo EIDOS 15. La sentencia INSERT
Como decíamos, si ahora intentamos insertar otra provincia si especificar el atributo CA_ID, que es
clave, se producirá un error, como podemos observar en la Figura 84 al ejecutar el Código fuente 82.
Código fuente 82
O si por el contrario introducimos un valor duplicado para la clave, también obtendremos el error de la
Figura 85 al ejecutar el Código fuente 83.
Código fuente 83
Figura 84
Otra forma de introducir filas es no especificando la lista de atributos, en cuyo caso los valores se van
asignando de manera secuencial a los atributos de la tabla. Por ejemplo en el Código fuente 84 se
asigna el valor 3 al atributo CA_ID y ‘Andalucía’ al atributo CA_Nombre.
141
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Figura 85
Código fuente 84
Del mismo modo se pueden especificar valores para los atributos en distinto orden, siempre que se
expresen de manera explícita en la lista de los mismos, como muestra el Código fuente 85, en el que se
asigna el código 1 a la provincia Madrid, que pertenece a la comunidad de Madrid (es decir, código 2).
Código fuente 85
Así mismo se pueden especificar menos valores que atributos, siempre que para los atributos que no se
especifiquen se puedan insertar valores nulos o los establecidos por defecto. La forma de asignar estos
valores por defecto es como se muestra en el Código fuente 86.
Código fuente 86
142
© Grupo EIDOS 15. La sentencia INSERT
Esto insertaría una nueva fila en la tabla, con los valores establecidos por defecto.
Otra forma de insertar filas es a partir del resultado de una consulta. Por ejemplo, el Código fuente 87
insertaría en la tabla 2, los valores de la tabla 1. Ni que decir tiene que ambos esquemas deben
coincidir. También se puede especificar un filtro en la claúsula where para la consulta.
Código fuente 87
143
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
144
© Grupo EIDOS 15. La sentencia INSERT
Código fuente 88
145
La sentencia SELECT
Introducción
La sentencia select es la principal manera que tiene el usuario de consultar información de la base de
datos. Veremos aquí algunos ejemplos de utilización, basándonos en los ejemplos que hemos visto en
el capítulo acerca del DDL.
La forma más simple de utilización es especificando una lista de atributos de una tabla. Así el Código
fuente 89 mostraría todos los datos referentes a comerciales
SELECT *
FROM Comercial
Código fuente 89
Código fuente 90
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
La claúsula WHERE
La forma de especificar una condición dentro de una sentencia select es mediante la claúsula WHERE,
que especifica una condición lógica que devolverá únicamente aquellos registros que la cumplan.
Por ejemplo, para obtener todos los inmuebles de la tabla de ofertas que se encuentran en venta,
deberíamos teclear el Código fuente 91.
SELECT *
FROM Oferta
WHERE Oferta.Of_Transaccion = ‘V’
Código fuente 91
O si queremos consultar todos los inmuebles cuyo precio oscile entre 100 y 2.000 euros, deberemos
ejecutar Código fuente 92.
SELECT *
FROM Oferta
WHERE Oferta.Of_Precio >= 100 and Oferta.Of_Precio <= 2000
Código fuente 92
SELECT *
FROM Oferta
WHERE Oferta.Of_Precio BETWEEN 100 and 2000
Código fuente 93
Si además deseamos especificar un orden, habrá que utilizar la claúsula ORDER BY.
Por ejemplo, el Código fuente 94 muestra el precio de todos los inmuebles de 100 a 2.000 euros,
ordenado de más caro a más barato, como muestra la Figura 86.
SELECT Oferta.Of_Precio
FROM Oferta
WHERE Oferta.Of_Precio BETWEEN 100 and 2000
ORDER BY Oferta.Of_Precio
Código fuente 94
148
© Grupo EIDOS 16. La sentencia SELECT
Figura 86
El operador join
Si la sentencia select es la más utilizada para consulta de información, el operador join es el más usado
para obtener información de tablas relacionadas. Si deseamos obtener datos de dos tablas que están
relacionadas por un atributo, deberemos utilizar este operador para obtener la información contenida
en ambas.
Por ejemplo, para obtener una información detallada de en que provincias se encuentran los
inmuebles, deberemos ejecutar el Código fuente 95.
Código fuente 95
De esta manera obtenemos la información de la provincia, que se encuentra en otra tabla distinta de la
de ofertas, y que se encuentra relacionada con ésta mediante la clave ajena Prv_ID.
En el anterior ejemplo se ha utilizado un inner join, pero también existen otros tipos de join, como
pueden ser el left outer y el rigth outer. La diferencia entre ambos ya se ha comentado en un capítulo
anterior, así que no se entrará en detalle. Si por ejemplo deseamos obtener todas las viviendas que no
149
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
han sido compradas todavía por ningún cliente, o que han sido asignadas a clientes erróneos
deberemos ejecutar el Código fuente 96.
Código fuente 96
En el anterior ejemplo, primero realizamos un inner join para obtener la provincia (caso de que no
exista no aparecería nada), y a continuación un left outer join con la tabla de clientes para obtener el
cliente que tiene asignado la oferta; si dicho cliente no existe en la base de datos, obtendremos ese
atributo a nulo.
Puesto que se ha utilizado una claúsula where que nos devuelve únicamente los clientes que tienen
dicho atributo a nulo, obtendremos los clientes que no tienen correspondencia con las ofertas.
Supongamos que ahora nos viene un cliente, y nos pregunta por todos los inmuebles, que sean pisos,
que se encuentren en alquiler y que pertenezcan a la provincia de Madrid. Habría que ejecutar el
Código fuente 97.
SELECT *
FROM Oferta
Inner join Provincia on Oferta.Prv_ID = Provincia.Prv_ID
and Provincia.Prv_Nombre = ‘Madrid’
inner join TipoBien on Oferta.TB_ID = TipoBien.TB_ID
and TipoBien.TB_Nombre = ‘Piso’
WHERE Oferta.Of_Transaccion = ‘A’
Código fuente 97
Aunque el anterior código es válido, hubiese sido más cómodo crear una vista como la siguiente:
Código fuente 98
SELECT *
FROM vInmuebles
150
© Grupo EIDOS 16. La sentencia SELECT
Código fuente 99
Vamos ahora a por un ejemplo con los transportes. Supóngase que se desea saber cuanto valen todos
los pisos que están próximos a una estación de cercanías o de metro. El código sería el siguiente:
SELECT Of_Precio
FROM Oferta
Inner join OfertaTransporte on Oferta.Of_ID = Transporte.Of_ID
Inner join Transporte on OfertaTransporte.Tr_ID = Transporte.Tr_ID
Inner join TipoTransporte on Transporte.TT_ID = TipoTransporte.TT_ID
And (TipoTransporte.TT_Nombre = ‘Metro’
or TipoTransporte.TT_Nombre = ‘Cercanias’)
Incluso podemos seleccionar todos los clientes que no han comprado ningún inmueble:
SELECT Cliente.Cli_Nombre
FROM Cliente
Left outer join Oferta on Oferta.Cli_NIF = Cliente.Cli_NIF
WHERE Oferta.Cli_NIF is null
SELECT Cli_NIF
FROM Cliente
WHERE Cli_NIF not in (SELECT Cli_NIF FROM Oferta)
151
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Figura 87
Sin embargo, T-SQL nos ofrece una forma más sencilla de realizar esta consulta, utilizando una
función de agregado que se denomina max. De esta manera obtenemos el máximo valor para el
atributo que especificamos para dicha función, como muestra el siguiente código equivalente:
SELECT max(Of_Precio)
FROM Oferta
Además de este función de agregado, SQL-SERVER nos ofrece otras muchas, que veremos en más
detalle a continuación.
Por ejemplo, y análogamente a max, encontramos la función min, encargada de devolver el registro
cuyo valor es el mínimo, dentro de la consulta especificada. El Código fuente 105 devolvería el
inmueble más barato de la provincia de Madrid.
SELECT min(Of_Precio)
FROM Oferta
Inner join Provincia on Provincia.Prv_ID = Oferta.Prv_ID and
Provincia.Prv_Nombre = ‘Madrid’
152
© Grupo EIDOS 16. La sentencia SELECT
Otra función muy usual es la de suma, expresada por sum, y cuyo cometido es devolver como
resultado la suma del atributo especificado entre paréntesis, dentro de la consulta especificada. Si
queremos obtener el dinero gastado por un cliente del que sabemos que su apellido empieza por
“Marti”, bastaría ejecutar el Código fuente 106.
SELECT sum(Of_Precio)
FROM Oferta
inner join Cliente on Oferta.Cli_NIF = Cliente.Cli_NIF
and Cliente.Cli_Apellidos like 'Marti%'
En el anterior código nos basamos en utilizar un join con la tabla de clientes utilizando el atributo
común Cli_NIF, restringiendo en ésta última tabla por aquellos clientes cuyo atributo apellidos
comience por Marti (claúsula like).
No menos importante es la función count, cuya misión es contar es numero de filas que devuelve la
consulta. En este caso, aunque se puede especificar un atributo entre paréntesis, lo más usual es poner
el comodín *, ya que el número de filas es similar es para todos los atributos. El Código fuente 107
serviría para contar el número de filas de la tabla Oferta, es decir, el número total de ofertas
almacenadas en la base de datos.
SELECT count(*)
FROM Oferta
SELECT count(*)
FROM Oferta
Inner join Provincia on Oferta.Prv_ID = Provincia.Prv_ID
And Provincia.Prv_Nombre = ‘Barcelona’
Para obtener media aritméticas, SQL-SERVER nos ofrece la función avg, para un atributo
determinado dentro de una consulta. Por ejemplo, el código que nos muestra la media del precio de los
inmuebles de Barcelona, seria equivalente al código que realiza los cálculos por separado.
153
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
El funcionamiento es similar para las funciones encargadas de calcular la desviación típica (stdev), la
desviación típica de la población (stdevp), la varianza estadística (var) y la varianza de llenado (varp).
La claúsula GROUP BY
Si deseamos obtener agrupaciones dentro de una consulta, deberemos utilizar esta claúsula. Si por
ejemplo deseamos obtener la media del precio de los pisos por provincias, en principio deberíamos
ejecutar el Código fuente 111.
Sin embargo, si ejecutamos este código, nos mostraría un error, ya que avg devuelve un registro, y
Prv_Nombre puede que no sea único, por lo que SQL SERVER se hace “un lio”. Para evitar esto,
debemos utilizar es la claúsula group by, para obtener los resultados agrupados; entonces tendremos
un avg por cada grupo que obtengamos. Modificamos el código para utilizar esta cláusula, y
obtenemos algo como la Figura 88.
Paralelamente al uso de group by se suele utilizar la claúsula having. Para entendernos, es como un
where pero que se aplica a grupos de registros, en lugar de a registros por si solos. Si modificamos la
anterior consulta para que sólo se devuelvan aquellas provincias cuya media de precio supera los
100.000 euros, lo lógico sería ejecutar el código.
154
© Grupo EIDOS 16. La sentencia SELECT
Figura 88
Sin embargo esto nos devuelve un error, ya que el where se aplica a registros y, al estar utilizando
group by deberemos especificar una función de agregado. Sustituimos el where por having en el
Código fuente 114.
Otra utilidad que ofrece la cláusula group by es la de obtener los valores distintos que aparecen para
uno o varios atributos. Por ejemplo, para obtener cuales son las provincias en las cuales tenemos algún
inmueble, podríamos ejecutar el código.
SELECT Prv_Nombre
FROM Oferta
inner join Provincia on Oferta.Prv_ID = Provincia.Prv_ID
155
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Sin embargo, esto nos devuelve un registro por cada oferta que se encuentre, con los consiguientes
duplicados. Para evitar esto, podemos utilizar la función dinstinct, como sigue.
SELECT distinct(Prv_Nombre)
FROM Oferta
inner join Provincia on Oferta.Prv_ID = Provincia.Prv_ID
Sin embargo esto no es válido si queremos realizar algún tipo de información adicional, por ejemplo
contar el número de inmuebles por provincia, que sí se resolvería utilizando la claúsula group by,
como muestra el Código fuente 117.
156
La sentencia UPDATE
Introducción
Esta sentencia es la que permite la actualización de la información almacenada en la base datos. Si la
sentencia insert se utilizaba para añadir nueva información, la sentencia update se utiliza para
modificar la información existente. Su sintaxis es la siguiente.
UPDATE <tabla>
SET <atributo> = <valor>
FROM <tablas>
WHERE <condicion>
Si se especifica más de una asignación de un valor a un atributo, éstas se deberán separar por comas.
La claúsula FROM se puede omitir, en el caso de sólo se necesite acceder a una tabla, que será la
misma que la que se actualice.
Ejemplos
Para comenzar veremos un ejemplo sencillo, que se muestra en el Código fuente 118 donde se
actualiza la dirección del comercial cuyo NIF es 11323K.
UPDATE Comercial
SET Com_Direccion = 'C/Esplandiu, 5'
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Para comprobar que efectivamente el cambio ha tenido efecto, vamos a consultar los datos de este
comercial, ejecutando el Código fuente 119, obteniendo el resultado de la Figura 89.
Figura 89
Pero no simplemente se puede actualizar una fila cada vez, sino que se pueden actualizar todas las filas
que coincidan con un criterio de búsqueda. Por ejemplo, se puede hacer subir a la categoría 4 a todos
los comerciales de Madrid, para la cual se deberá ejecutar el Código fuente 120.
UPDATE Comercial
SET Com_Categoria = '4'
FROM Comercial, Provincia
WHERE Comercial.Prv_ID = Provincia.Prv_ID
and Prv_Nombre = 'Madrid'
158
© Grupo EIDOS 17. La sentencia UPDATE
En este caso hemos tenido que especifica la claúsula from para acceder a la tabla de provincias,
aunque no sea ésta la que se actualice, ya que necesitábamos conocer el identificador correspondiente
a la provincia de Madrid. Para comprobar si se han actualizado los datos, y sólo los correspondientes a
la provincia de Madrid, ejecutamos el Código fuente 121.
Figura 90
Hasta ahora sólo hemos actualizado un atributo; pero como hemos dicho, es posible actualizar más de
uno simultáneamente. Por ejemplo, el Código fuente 122 muestra como actualizar la dirección y el
teléfono del cliente Juan Jose Martinez.
UPDATE Cliente
SET Cli_Direccion = 'C/Apache 35', Cli_Telefono = '912237887'
WHERE Cli_Nombre = 'Juan Jose' and Cli_Apellidos = 'Martinez'
159
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Para comprobar que se ha actualizado correctamente el registro, ejecutamos el Código fuente 123,
obteniendo el resultado de la Figura 91.
SELECT *
FROM Cliente
WHERE Cli_Nombre = 'Juan Jose' and Cli_Apellidos = 'Martinez'
Figura 91
Del mismo modo, no hace falta especificar un valor a la hora de actualizar uno o varios atributos, sino
que se puede indicar una expresión. Por ejemplo, podemos subir el precio de todos los inmuebles de
Barcelona un 5%. Primero ejecutaremos el Código fuente 124 para comprobar cual es el precio de
estos inmuebles.
Ahora ejecutamos el Código fuente 125 para actualizar su precio a un 5% más de su valor actual.
160
© Grupo EIDOS 17. La sentencia UPDATE
UPDATE Oferta
SET Of_Precio = Of_Precio + (Of_Precio * 0.05)
FROM Oferta, Provincia
WHERE Provincia.Prv_ID = Oferta.Prv_ID and Prv_Nombre = 'Barcelona'
Y para comprobar que efectivamente se han actualizado estos registros, ejecutamos nuevamente el
Código fuente 126.
De la misma forma que para la sentencia select, update nos permite la utilización de las funciones de
agregación, para el cálculo de expresiones. Por ejemplo, actualizaremos la categoría del comercial
dependiendo del número de inmuebles que haya vendido cada uno. Si ha vendido entre 0 y 2, la
categoría a asignar será de 1, entre 3 y 4 será 2, entre 5 y 6 será 3, y así sucesivamente. Para calcular
dicha categoría podemos aplicar la siguiente fórmula:
Vayamos paso a paso; primero veamos cuantos inmuebles ha vendido cada comercial, ejecutando la
sentencia del Código fuente 127.
Por lo tanto vemos que la asignación de categorías sería 1 para Juan Alberto y Pedro, y 4 para Luis.
Ejecutemos ahora el Código fuente 128 que nos permite hacer esto.
UPDATE Comercial
SET Com_Categoria =
((SELECT count(*) / 2 FROM
Oferta where Comercial.Com_NIF = Oferta.Com_NIF) +
(SELECT count(*) % 2 FROM
Oferta where Comercial.Com_NIF = Oferta.Com_NIF))
161
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Lo primero que se ha hecho es para cada comercial calcular el número de ofertas que tiene
relacionado, para dividirlo por 2, calcular su módulo 2 y luego sumarlo y asignarlo al campo categoría.
Si ejecutamos una selección, como la que se muestra en el Código fuente 129 para comprobar que
efectivamente la actualización se ha realizado con éxito, nos encontraríamos con lo siguiente.
162
La sentencia DELETE
Introducción
La sentencia delete es la que nos permite borrar tuplas almacenadas en la base de datos. Su sintaxis es
la siguiente.
Donde tabla especifica el nombre de la tabla de donde se desean borrar las filas que cumplen la
condición especificada en la claúsula where. Si ésta se omite, se borrarán todas las filas de la tabla
especificada (mucho cuidado con esto).
Si por ejemplo ejecutamos el Código fuente 130, nos encontraremos con que se borrará la oferta cuyo
código es 11 de la tabla de ofertas.
Para comprobar si se ha borrado dicho registro, podemos hacer una select completa de la tabla y
verificar que falta dicho registro aunque, lo más sencillo, y conociendo que el registro que hemos
borrado era el último introducido, podemos obtener el máximo valor para el atributo Of_ID, y
comprobar que no es superior a 10, ejecutando el Código fuente 130.
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
SELECT max(Of_ID)
FROM Oferta
La integridad referencial
Un aspecto a tener en cuenta es el no violar las reglas de integridad referencial que sostienen la base
de datos. Recordemos al lector que estas reglas son las que permiten mantener la información de la
base de datos en un estado coherente, para evitar posibles inconsistencias que pudieran surgir al
eliminar atributos que son clave ajena en otra relación.
Para comprender mejor esto, supongamos que borramos todos los comerciales de la base de datos.
Esto supondría que tendríamos ofertas inconsistentes, es decir, hacen referencia a comerciales que ya
no existen en la base de datos.
Para evitar esto, las reglas de integridad nos permiten olvidarnos a la hora de borrar un registro, si éste
esta relacionado con alguna otra tabla, evitando esta pérdida de información.
Si lo hemos hecho bien, cuando pretendamos borrar una tupla de estas características, el SGBD nos
advertirá de ello y no nos dejará borrarla.
De esta manera, si por ejemplo queremos borrar el comercial Luis Canto, ejecutaremos el Código
fuente 132.
que, como cabía esperar, nos da un error. Es decir, primero deberemos borrar todas las ofertas en las
que haya participado dicho comercial, ejecutando el Código fuente 133.
Sin embargo, al ejecutar este código nos encontramos en la misma situación, ya que resulta que
existen filas en la tabla que relaciona las ofertas y los transportes, que hacen referencia a dicha oferta.
Por lo tanto, primero deberemos borrar éstas, como muestra el Código fuente 134.
164
© Grupo EIDOS 18. La sentencia DELETE
Una vez borradas las filas de OfertaTransporte, volvemos atrás para borrar las filas de Oferta,
ejecutando el Código fuente 135.
Y una vez borradas las ofertas de dicho comercial, ya le podemos eliminar de la base de datos, sin
preocuparnos de posibles inconsistencias, con el Código fuente 136.
La instrucción DELETE quita una a una las filas y graba una entrada en el registro de transacciones
por cada fila eliminada. TRUNCATE TABLE quita los datos al cancelar la asignación de las páginas
de datos utilizadas para almacenar los datos de la tabla y sólo se graba en el registro de transacciones
la página de asignaciones quitadas.
TRUNCATE TABLE quita todas las filas de una tabla, pero permanece la estructura y sus columnas,
restricciones, índices, etc. El contador utilizado por una identidad para las nuevas filas se restablece al
valor de inicialización de la columna. Si desea conservar el valor del contador, se debe utilizar delete
en su lugar.
Por ejemplo, el Código fuente 137 borraría todos los datos de la tabla Cliente
165
Bases de datos con SQL Server2000 – Transact SQL © Grupo EIDOS
Ejemplos
Veamos ahora algunos ejemplos para afianzar al lector en el uso de esta sentencia. Por ejemplo, y al
igual que hacíamos con la sentencia select, se puede utilizar el resultado de una subconsulta para
borrar un conjunto de registros.
Por ejemplo, si queremos borrar todas las ofertas de la Catalunya, podemos utilizar una subconsulta
que nos devuelva los identificadores de las provincias pertenecientes a dicha comunidad, para a
continuación efectuar el borrado de toda las ofertas que contengan dicho identificador, utilizando para
ello el operador de contenido (in).
Sin embargo, primero habrá que borrar todas las filas de OfertaTransporte que estén relacionadas con
éstas, para lo cual podemos volver a ejecutar una subconsulta en un segundo nivel para obtener dichas
filas. Para ello ejecutamos el Código fuente 138
De esta manera y, una vez borradas todos los transportes disponibles para la oferta, borraremos las
ofertas como era nuestra pretensión, ejecutando el Código fuente 139.
Además de especificar una tabla en una sentencia delete, se puede indicar una consulta. Por ejemplo,
el Código fuente 140 mostraría como borrar las dos primeras ofertas.
DELETE Oferta
FROM (SELECT top 2 * FROM Oferta) as t
Puesto que esto devuelve un error debido a la integridad referencial, deberemos ejecutar primero el
Código fuente 141que elimine las filas de OfertaTransporte relacionadas.
166
© Grupo EIDOS 18. La sentencia DELETE
DELETE OfertaTransporte
FROM (SELECT top 2 * FROM Oferta) as t
WHERE t.Of_ID = OfertaTransporte.Of_ID
En este código, se ha utilizado una subconsulta como tabla, especificando para la misma un alias (t),
que nos servirá para luego hacer referencia a dicha subconsulta en la claúsula where. Aquí, por
ejemplo, se utiliza para hacer un join con la tabla OfertaTransporte, que permita borrar dichas filas.
En este código, se ha utilizado una subconsulta como tabla, especificando para la misma un alias (t),
que nos servirá para luego hacer referencia a dicha subconsulta en la claúsula where. Aquí, por
ejemplo, se utiliza para hacer un join con la tabla OfertaTransporte, que permita borrar dichas filas.
167
Procedimientos almacenados y triggers
Introducción
Los procedimientos almacenados son conjuntos de sentencias en leguaje Transact SQL que pueden
almacenarse en el propio servidor. Los procedimientos almacenados de SQL Server, son más potentes,
porque permiten almacenar funciones y procedimientos compuestos por varias instrucciones,
introducir saltos, bucles, etc. También se pueden compilar procedimiento escritos en lenguaje C, para
ampliar su potencia modularmente.
Por ejemplo, podemos crear un procedimiento para recuperar el nombre de un autor, cuyo código se
pasa por parámetro.
ObtenerNombre '123'
• Pasando los argumentos nombrados. En este caso no hace falta que los parámetros vayan en el
mismo orden.
Si por ejemplo, queremos obtener el número de autores y el número de libros que tenemos en la base
de datos, crearemos el procedimiento almacenado que muestra el Código fuente 145.
Primero contamos todas las filas de la tabla authors, realizando un SELECT * FROM Authors. A
continuación devolvemos en el parámetro @autores el valor obtenido, utilizando @@ROWCOUNT.
Acto seguido se realiza lo mismo para la tabla titles. Nótese como la forma de asignar un valor a un
atributo es mediante una sentencia SELECT, igualando el parámetro al valor.
170
© Grupo EIDOS 19. Procedimientos almacenados y triggers
El Código fuente 146, por lo tanto, se podría sustituir por Código fuente 147.
1. Declarar las variables que vamos a utilizar para llamar al procedimiento. La sintaxis para
declarar una variable es utilizar la palabra reservada DECLARE, seguido del nombre de la
variable y el tipo.
Tras ejecutar las anteriores sentencias, obtendremos como resultado el siguiente listado:
autores libros
--------------- ---------------
23 18
(1 row(s) affected)
171
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 92
Así, si escribimos sp_who, obtendremos una lista con todos los usuarios conectados, como podemos
observar en la Figura 92.
Si queremos obtener una lista con todas las tablas del sistema, disponemos de otro procedimiento
almacenado denominado sp_tables. Del mismo modo, si deseamos conocer todos los atributos de una
tabla, deberemos ejecutar sp_columns seguido del nombre de la tabla.
172
© Grupo EIDOS 19. Procedimientos almacenados y triggers
Por ejemplo, para listar los atributos de la tabla authors ejecutamos sp_columns authors, y
obtenemos el resultado de la Figura 93
Existe una gran variedad de procedimientos almacenados, como por ejemplo para crear dispositivos,
para comprobar el espacio usado por una tabla, etc. Aquí sólo hemos visto dos ejemplos de aplicación.
Figura 93
De todos es conocida la potencia que ofrece el lenguaje C, ya que es un compilador a bajo nivel. Esto
es, permite interaccionar con el hardware, obtener datos del Sistema Operativo, etc. La técnica que
permite el aprovechamiento de un lenguaje externo a SQL Server, para el diseño de procedimientos
almacenados se denomina Extended Stored Procedures.
Este es un caso un poco más complicado que el manejo de procedimientos almacenados intrínsecos al
propio SQL Server. Los Extended Stored Procedures se implementan como DLLs, que serán
privadas a SQL Server, y cuya gestión del espacio de memoria corresponde a éste. Una DLL
(Dinamic Link Library) es un conjunto de funciones, que se cargan dinámicamente en memoria,
esto es, se cargan en memoria cuando vayan a ser usadas, y se descargan cuando no se necesiten. Si
por ejemplo, uno de estos procedimientos intenta acceder a una dirección que cae fuera del espacio de
173
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
direcciones permitido, SQL Server atrapa la excepción, mata la tarea, y libera los bloqueos,
continuando normalmente con su trabajo.
Para registrar una Extended Stored Procedure, el administrador del sistema deberá ejecutar la
sentencia en Transact SQL que aparece en el Código fuente 152.
Para ejecutar una de estas funciones en una base de datos distinta de aquella en la que se ha registrado,
se deberá preceder el nombre de la base de datos al nombre de la función.
Hay que destacar que estos procedimientos únicamente podrán ser ejecutados y registrados por el
administrador del sistema. Si éste desea permitir la ejecución a los demás usuarios, deberá ejecutar el
Código fuente 153.
Esta sentencia SQL otorga (GRANT) privilegios de ejecución (EXEC) sobre el procedimiento
especificado, a todos los usuarios de la base de datos. Si sólo deseamos otorgar este privilegio a un
usuario, deberemos especificar su identificador de usuario tras TO.
Triggers
Los disparadores de procedimiento, más comúnmente conocidos como triggers, son una especie de
procedimientos almacenados, a diferencia que se ejecutan cuando ocurre un evento sobre alguna tabla.
Entendemos por evento, cualquier acción del tipo:
• Inserción
• Borrado
• Actualización
donde acción especifica el evento que debe ocurrir para que se dispare el trigger, y que puede ser:
• UPDATE: actualización.
• INSERT: inserción.
• DELETE: borrado.
174
© Grupo EIDOS 19. Procedimientos almacenados y triggers
Por ejemplo, si queremos crear un trigger llamado modificación_autor, sobre la tabla Authors, que
muestre un mensaje cada vez que se actualiza una fila de la tabla, deberemos escribir el Código fuente
154.
Para comprobar el funcionamiento de este trigger, podemos actualizar cualquier fila de la tabla de
autores, por ejemplo con la sentencia que aparece en el Código fuente 155.
Con esto conseguimos dos cosas, actualizar el nombre del autor cuyo código es el especificado a
Miguel, y obtener el mensaje que se muestra como ejecución del trigger de actualización.
Sin embargo, los triggers en SQL Server tienen una serie de limitaciones:
1. No se puede disparar un trigger dentro de otro trigger, ya que daría lugar a un bucle infinito
2. Por esta razón, un trigger no puede ejecutar instrucciones DDL (lenguaje de definición de
datos)
Del mismo modo, para borrar un trigger, deberemos ejecutar la sentencia DROP TRIGGER trigger.
Por ejemplo, si queremos borrar el trigger anteriormente creado, ejecutaremos el Código
fuente 156
175
Ejemplos prácticos de uso de
procedimientos almacenados
Introducción
Los procedimientos almacenados es una de las principales funcionalidades que ofrece SQL-Server,
que permite al usuario que los usa abstraerse de la complejidad interna que puede encerrar. Por
ejemplo, pueden ser llamados desde otras aplicaciones, con los parámetros adecuados, siendo el
servidor el encargado de realizar las operaciones, descargando de trabajo al cliente.
Los procedimientos almacenados suelen utilizar sentencias de diverso tipo de T_SQL, como pueden
ser las de control de flujo, las de iteración, etc., que veremos en detalle mediante algunos ejemplos
prácticos.
El Código fuente 157 muestra un procedimiento almacenado encargado de insertar un nuevo tipo de
transporte si no está dado de alta en la base de datos. Para ello se comprueba que el número de filas
que devuelve el select sea cero, en cuyo caso la condición es verdadera, y se ejecutará el insert.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Probemos a insertar un tipo de transporte que exista, y otro que no exista, para comprobar como
funciona. Para ello ejecutamos el Código fuente 158.
Para comprobar lo que ha ocurrido en la tabla de tipos de transporte, ejecutamos el siguiente código.
SELECT *
FROM TipoTransporte
Y como podemos comprobar, sólo se ha insertado el último registro. Podemos hacerlo un poco más
elegante, y devolver un parámetro que nos indique si ha habido error o no.
Podemos observar una novedad, y es que se ha encerrado entre las palabras begin...end el bloque que
deseamos se ejecute cuando se cumple la condición, además del uso de la sentencia set para asignar un
valor a un parámetro o variable. Para ejecutar ahora el procedimiento, necesitamos un parámetro más
de llamada, que devolverá ‘S’ si se ha producido error, y ‘N’ si se ha insertado el registro con éxito,
cuyo tipo debe coincidir con el tipo del parámetro de salida declarado en el procedimiento.
178
© Grupo EIDOS 20. Ejemplos prácticos de uso de procedimientos almacenados
Al ejecutar este código, mostramos el parámetro de salida y vemos como, efectivamente, se devuelve
una ‘S’, lo que indica que se ha producido un error. Sin embargo, si ejecutamos este otro código, se
devolverá una ‘N’, lo que indica que el registro se ha insertado correctamente, al no existir todavía en
la base de datos.
Otro ejemplo nos muestra como comprobar si existen filas para un parámetro determinado, con el fin
de mostrar un mensaje determinado.
En este código podemos comprobar como se obtiene el número de registros de un inner join, para
obtener el identificador de la provincia que coincide con el nombre que se pasa como parámetro. Si
dicho atributo es nulo, querrá decir, al ser un inner join, que o bien no existe la provincia, o bien no
existe ningún comercial asociado a ella. Ejecutemos el procedimiento para comprobar si existen
comerciales para la provincia de Barcelona.
La sentencia CASE
Una variante a la instrucción if...else es la sentencia case, muy útil sobre todo cuando tenemos muchos
if anidados. Por ejemplo, el código expuesto antes utilizando if...else, equivaldría al siguiente,
utilizando case.
179
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Esto puede resultar muy útil para montar sentencias en tiempo de ejecución, cuyos valores no
conocemos a priori, o para los cuales deseamos realizar un tratamiento distinto dependiendo de los
valores que tomen.
180
© Grupo EIDOS 20. Ejemplos prácticos de uso de procedimientos almacenados
Manejamos dos variables, una almacenará la condición, que se ira concatenando, dependiendo de los
parámetros que se indiquen, y otra almacenará el join que se deberá realizar con la tabla de provincia,
en el caso de que se especifique como parámetro el nombre de la provincia. Una vez montadas estas
cadenas, se ejecuta la sentencia exec, para evaluar la expresión resultante.
Conversión de tipos
Muchas veces nos encontraremos la necesidad de convertir un valor de un tipo a otro tipo para operar
con él. Es entonces cuando intervienen dos instrucciones que nos permiten realizar esto. Dichas
instrucciones son cast y convert.
y la de convert.
181
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Por ejemplo, podemos utilizarlo para convertir un tipo de datos carácter a fecha.
O un carácter a entero
La sentencia WHILE
La instrucción while permite iterar un numero de veces que no conocemos a priori, hasta que deje de
cumplirse la condición boleana. Su sintaxis es la siguiente.
WHILE expresion
sentencias
[BREAK]
[CONTINUE]
La claúsula break es optativa y indica al bucle que deje de ejecutarse, mientras que la claúsula
continue, que también es optativa, indica al bucle que se reinicie.
En el siguiente ejemplo, se recorre los comerciales, mientras que la categoría sea distinta de 6, y va
duplicando la misma, hasta que alguno supera el valor de 6.
182
Triggers en SQL-Server 2000
Introducción
Como ya se ha comentado, los triggers o desencadenadores son una especie de procedimientos
almacenados, que se ejecutan cuando ocurre una acción dentro de la base de datos. Así, si por ejemplo
se ejecuta una inserción, una actualización, o un borrado de una tabla, se ejecutarían las sentencias
definidas para el trigger en concreto de esa tabla específica.
Las palabras reservadas DELETE, INSERT y UPDATE corresponden a cada una de las acciones para
las cuales se puede definir un desencadenador dentro de la tabla especificada.
El bloque de sentencias permite prácticamente cualquier tipo de ellas dentro del lenguaje T-SQL, pero
con ciertas limitaciones. Por ejemplo, no se podrá utilizar la sentencia select, ya que un trigger no
puede devolver datos al usuario, sino que simplemente se ejecuta para cambiar o comprobar los datos
que se van a insertar, actualizar o borrar.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
La utilidad de estas dos tablas es la de realizar comprobaciones entre los datos antiguos y los nuevos.
Así, por ejemplo, si queremos recuperar los datos de la tabla que estamos borrando, dentro del trigger,
se deberá ejecutar el siguiente código:
SELECT *
FROM deleted
Tipos de desencadenadores
SQL-Server permite la definición de varios tipos de triggers, entre los cuales cabe destacar los
siguientes:
• Desencadenadores múltiples: para una misma tabla, se pueden definir distintos triggers para la
misma acción, es decir, si definimos un trigger para insert, y resulta que dicha tabla ya tenía
definido un trigger para esa misma acción, se ejecutarán ambos triggers cuando ocurra dicho
evento sobre la tabla.
• Desencadenadores anidados: si un trigger cambia una tabla en la que se encuentra definido otro
trigger, se provoca la llamada de este último que, si a su vez vuelve a modificar otra tabla, puede
provocar la ejecución de otro trigger, y así sucesivamente. Si se supera el nivel de anidamiento
permitido, se cancelará la ejecución de los triggers.
• Aunque un trigger se defina dentro una sola base de datos, puede hacer referencia a objetos que se
encuentran fuera de la misma
• La misma acción del desencadenador puede utilizarse para definir más de un trigger sobre la
misma tabla
184
© Grupo EIDOS 21. Triggers en SQL – Server 2000
• Así mismo, no se permite la utilización de las sentencias del DDL dentro de la definición de un
trigger
Ejemplos
Veamos a continuación algunos ejemplos que complementen lo visto hasta ahora. El siguiente código,
muestra la forma de enviar un mensaje de correo electrónico a una persona, cuando se añade una
nueva oferta.
Sin embargo, si queremos que se envíe el mensaje cada vez que se cambia algo en la tabla de ofertas,
deberemos reescribir el trigger para las acciones update y delete, como se muestra en el siguiente
código.
185
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
En el Código fuente 178, se muestra como crear un trigger que, utilizando la tabla inserted para
comprobar los valores que se van a añadir o modificar, posibilite la cancelación de la acción, si el
nivel del trabajo no está dentro de los valores permitidos.
Primero declaramos las variables min_lvl y max_lvl, que almacenarán los valores mínimo y máximo
permitidos para un trabajo, emp_lvl, que almacenará el nivel para el empleado, y job_id que almacena
el identificador del trabajo que se va a actualizar.
Ahora se comprueba si el trabajo que estamos asignando es el 1, en cuyo caso el valor para el nivel
debería ser 10. Para ello comprobamos esta situación mediante un if y, en caso de que sea verdadero,
se lanza un error con la sentencia RAISERROR, y se cancela la transacción con ROLLBACK
TRANSACTION.
186
© Grupo EIDOS 21. Triggers en SQL – Server 2000
En otro caso se comprueba que el nivel de la tarea esté dentro de los límites permitidos para el
empleado. Si esto no se cumple se volverá a lanzar un error, y se cancelará la transacción.
Para los desconocedores del lenguaje C, quizá la última sentencia RAISERROR no les sea demasiado
clara. Destacar, simplemente, que cada %d que aparece dentro de la cadena de texto será sustituido
respectivamente por el valor de cada una de las tres últimas variables que aparecen dentro de dicha
sentencia.
187
Seguridad
Introducción
El de la seguridad es un tema muy importante, para la protección de la información, sobre todo en
entornos grandes, donde la amenaza de potenciales accesos indebidos es muy grande.
• Seguridad física: entendemos por seguridad física aquella que persigue salvaguardar los datos
de agresiones externas, como por ejemplo la destrucción de la base de datos, debido a aspectos
físicos, como por ejemplo un incendio o una inundación.
En este capítulo nos centraremos en la seguridad lógica, ya que la seguridad física afecta a aspectos de
administración (copias de seguridad, mantenimientos de dispositivos duplicados con mirror, etc.) que
escapan a los objetivos del presente curso.
Concesión de privilegios
SQL Server mantiene un sistema de perfiles, en el que la principal división se establece entre el
administrador del sistema y el resto de usuarios. El administrador del sistema actúa al nivel de
superusuario, y puede realizar "casi" cualquier operación, mientras que un usuario corriente sólo podrá
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
realizar operaciones que afecten a sus objetos, o a los objetos que le permita el administrador u otro
usuario.
Los objetos de SQL Server (tablas, bases de datos, ...) tienen un propietario, que normalmente suele
ser el superusuario, o el usuario que lo haya creado. En principio, si otro usuario desea acceder a dicho
objeto, no podrá hacerlo, a menos que el propietario o el administrador le dé permiso. Los permisos se
pueden establecer en el ámbito de un usuario (conceder un privilegio a un usuario) o en el ámbito de
grupo o público (accesible por todos).
Del mismo modo, los permisos pueden ser propagados en cascada, esto es, un usuario puede dar
permiso a otro usuario, para que éste a su vez pueda dar permiso a otros.
Por ejemplo, si queremos otorgar el permiso de crear bases de datos y tablas al usuario Pepe,
deberemos escribir la sentencia que muestra Código fuente 179
Si queremos otorgar todos los permisos a todos los usuarios, deberemos escribir la sentencia que
aparece en el Código fuente 180.
Cuidado con esta sentencia ya que es muy peligroso dejar que cualquier usuario haga lo que quiera. De
todas maneras, este control corresponde al administrador del sistema.
Del mismo modo se pueden establecer privilegios sobre los objetos, en lugar de sobre las acciones. En
este caso, la sintaxis es la mostrada
La sentencia GRANT permite establecer los permisos deseados (inserción, borrado, actualización)
sobre una serie de atributos de una tabla, a unos determinados usuarios. No sólo se pueden conceder
permisos en el ámbito de tabla, sino también en el ámbito de vista, o procedimientos almacenados.
Por ejemplo, si deseamos que todos los usuarios puedan consultar la tabla de autores, deberemos
escribir lo que indica el Código fuente 181.
190
© Grupo EIDOS 22. Seguridad
Con esto lo que hacemos es conceder el permiso SELECT sobre la tabla Authors, a todos los usuarios.
Si queremos restringir el SELECT al campo au_lname, deberemos ejecutar el Código fuente 182.
Y si deseamos que además de consultar se pueda actualizar, la sentencia en cuestión es la que muestra
el Código fuente 183.
Si queremos propagar los privilegios, debemos adjuntar la opción WITH GRANT OPTION. Por
ejemplo, si queremos conceder el privilegio de ejecución de un procedimiento almacenado a un
usuario, y que éste a su vez pueda conceder este privilegio a otros usuarios, debemos escribir la
sentencia mostrada en el Código fuente 184.
Revocación de privilegios
La sentencia homóloga a la concesión de privilegios es REVOKE. Con esta sentencia podemos quitar
permisos a los usuarios sobre un objeto, o para ejecutar ciertas sentencias. La sintaxis para quitar
permisos sobre la ejecución de sentencias es la siguiente:
donde sentencia especifica aquellas cuyos permisos se revocan, y usuarios establece una lista de
usuarios a los cuales se les aplicará dicha sentencia. Por ejemplo, si ejecutamos el Código fuente 185.
Para revocar todos los permisos, deberemos especificar ALL como sentencia a aplicar.
191
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Así mismo, para que la sentencia tenga efecto para todos los usuarios de la base de datos, deberemos
establecer public en la lista de usuarios. Por ejemplo, el Código fuente 186 revoca todos los permisos
a todos los usuarios.
La sentencia para aplicar revocación de permisos a objetos aparece en el Código fuente 187.
Por ejemplo, si queremos revocar los permisos de inserción de filas en la tabla autores, al usuario
Pepe, escribimos lo que indica el Código fuente 188.
Si no queremos que dicho usuario consulte los atributos au_lname y au_fname de dicha tabla, la
sentencia a ejecutar aparece en el Código fuente 189.
Y si queremos revocar dicho permiso no sólo al usuario Pepe, sino también a todos los usuarios a los
que éste a otorgado dicho permiso, ejecutaremos el Código fuente 190.
192
© Grupo EIDOS 22. Seguridad
Denegación de permisos
Otra opción es la de denegar un permiso a uno o varios usuarios. Lo que permite es que dichos
usuarios no obtengan privilegios, hasta que no se revoque dicha denegación. La sintaxis para denegar
permisos es la siguiente:
Y para objetos:
Si por ejemplo, tenemos un usuario de la base de datos un tanto conflictivo, y no queremos que cree
bases de datos, bastará con revocarle el privilegio a hacerlo. Pero el problema surge cuando el
administrador del sistema se olvida de este detalle y, por error, le concede dicho permiso. Para evitar
que esto suceda, lo recomendable es denegar el permiso a dicho usuario.
De esta manera, mientras no se revoque dicha denegación, no se le podrán conceder privilegios para la
creación de bases de datos a dicho usuario. Del mismo modo podemos actuar para denegarle el
permiso de acceder a determinados campos de una tabla, como por ejemplo a los atributos au_lname y
au_fname de la tabla de autores.
Mantenimiento de vistas
Otro método para controlar la seguridad y el acceso indebido a los datos almacenados, consiste en
mantener vistas de la base de datos. Una vista es un conjunto de información que es accesible por uno
o varios usuarios. Como ya se vio en la parte anterior sobre diseño de bases de datos, las vistas se
corresponden con el esquema externo de la base de datos, es decir la porción de la base de datos que es
accesible a los usuarios. También se dijo que podía haber más de un esquema externo, lo que nos lleva
a pensar que la base de datos puede mantener varias vistas a la vez.
El lector se preguntará ¿por qué una vista impide realizar accesos indebidos?. Pues bien, la respuesta
es fácil. Puesto que una vista se puede contemplar como una consulta a una parte de la información, si
queremos que un usuario no acceda a determinados datos, le daremos vistas que no consulten dicha
información. Corresponde al administrador en este caso el estudio de las consultas que se pueden
realizar con relación a los usuarios del sistema, y otorgar permisos sobre las vistas a éstos.
193
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
La opción WITH ENCRYTION permite encriptar, es decir, ocultar, el código de la vista, mientras que
la opción WITH CHECK OPTION permite hacer visibles las modificaciones realizadas tras la
ejecución de la vista.
Por ejemplo, si queremos crear una vista sobre el atributo au_lname de la tabla authors, escribimos el
Código fuente 193.
Si un usuario quiere consultar ahora los autores de la base de datos, deberá ejecutar la vista,
escribiendo la sentencia que muestra el Código fuente 194
Recomendaciones
Por último, existen una serie de recomendaciones, que todo administrador que se precie debe tener en
cuenta a la hora de implementar la seguridad de una base de datos:
• Proporcionar un único identificador a cada usuario, para de esta manera saber en todo
momento quien está haciendo qué.
194
Ejemplo práctico de implementación
Introducción
En este capítulo, estudiaremos un ejemplo, para recopilar los conocimientos aprendidos a lo largo del
curso. El problema en sí es mantener una base de datos de ornitología (ciencia que estudia las aves).
Se desea almacenar la información de cada una de las especies del país. De cada especie se quiere
conocer el nombre de la misma, el nombre científico, la clase a la que pertenece y el tipo de árbol en el
que anida, así como si es un ave migratoria o no. De cada clase de árbol, se desea conocer su nombre,
el tipo de hoja, y la región de la cual es autóctono.
• ave-árbol: un ave puede anidar en varios tipos de árboles, y en un árbol pueden anidar varias
especies (N-M).
• árbol-región: un árbol puede ser autóctono de varias regiones, y en una región puede haber
distintas clases de árboles (N-M).
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Con la anterior información, podemos obtener el diagrama entidad-relación que vemos en la Figura
94.
Figura 94
Una vez realizado el diseño conceptual, el siguiente paso es realizar el diseño lógico, cuya primera
etapa es el paso a tablas. Cada entidad genera una tabla, con sus atributos, y las relaciones N-M
generan también tabla, con las claves de ambas entidades como atributos. Con esto, nos queda el
esquema lógico que muestra la Figura 95.
Figura 95
El siguiente paso en el diseño es realizar el diseño físico, ya que en nuestro caso no se aplicarán
métodos de normalización o particionamiento. Lo que realizaremos es codificar las instrucciones
necesarias en Transact SQL, para obtener el esquema físico. Destacar que lo que aquí entendemos por
diseño físico, también engloba al diseño lógico específico, al usar un SGBD concreto para la
implementación.
Para implementar el esquema en Transact SQL, utilizaremos el Query Analizer de SQL Server.
Una vez creada la base de datos, nos conectamos a ella, seleccionándola de la lista desplegable que
aparece en la parte superior derecha del Query Analizer.
196
© Grupo EIDOS 23. Ejemplo práctico de implementación
A continuación crearemos las tablas obtenidas en el esquema lógico. Empezaremos por crear la tabla
ave.
En la anterior sentencia cabe destacar que los atributos cod_ave y nombre han sido declarados como
no nulos, es decir, no se podrá insertar filas que no tengan valores nulos para dichos atributos. Para
especificar si un ave es migratoria o no, se utilizará un campo bit, es decir, un 0 para indicar que el ave
no es migratoria, y un 1 si lo es. Análogamente, creamos la tabla arbol.
Y por último las tablas que las relacionan, que son ave_arbol, y arbol_region:
Una vez creadas las tablas, el siguiente paso es crear los índices para ellas. Empezaremos por crear un
índice único que será la clave de la tabla ave, al que llamaremos clave, y que utilizará el campo
cod_ave.
197
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Análogamente hacemos con las demás tablas, donde los índices de clave única serán por cod_arbol
para la tabla arbol, por cod_región para la tabla región, por cod_arbol y cod_region para la
tabla.arbol_region, y por cod_ave y cod_arbol para la tabla ave_arbol:
Oh, !vaya!, nos hemos olvidado de definir un atributo para la tabla ave. Pero eso no es problema, ya
que podemos modificar cómodamente el esquema de dicha tabla, mediante la sentencia ALTER, para
introducir un nuevo campo.
Por último, es labor del administrador el decidir a quien y sobre que objetos otorga qué permisos.
Nosotros, de momento, crearemos una vista para consultar todas las aves que son migratorias
• Tabla ave
198
© Grupo EIDOS 23. Ejemplo práctico de implementación
Tabla 33
• Tabla árbol
1 Encina Caduca
2 Roble Perenne
3 Naranjo Caduca
4 Pino Perenne
Tabla 34
199
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• Tabla región
Cod_region Desc_region
1 Centro
2 Sur
3 Nor-noroeste
4 Pirineos
5 Levante
Tabla 35
Supongamos ahora que nos dicen que puede haber pinos en las regiones centro, nor-noroeste y
Pirineos, naranjos en la región Levante, encinas en las regiones centro, sur y nor-noroeste y robles en
la región centro. Lo que tenemos que hacer es dar de alta estas filas en la tabla arbol_region, con los
valores correspondientes a cada código de arbol y región.
200
© Grupo EIDOS 23. Ejemplo práctico de implementación
Supongamos ahora que nos dicen que el mirlo blanco anida en los naranjos y en los pinos, y que los
patos salvajes anidan en los estanques donde preferentemente haya encinas.
Lo que hay que hacer es crear las filas correspondientes a cada uno de los códigos en la tabla
ave_arbol.
Puesto que de momento no hemos encontrado ningún mirlo blanco, cambiaremos este ave por el mirlo
común. Para ello debemos actualizar la fila correspondiente, con la sentencia que aparece en el Código
fuente 209.
Supongamos ahora que queremos realizar las siguientes consultas, cuyas sentencias se especifican a
continuación:
Lo que hace la anterior sentencia es obtener el atributo desc_arbol de la tabla arbol. Para ello,
primero se pone la condición de que la región debe ser centro.
Con las filas obtenidas, hacemos un join contra la tabla arbol_region, para obtener el código
de los árboles cuya región es centro. Si ahora queremos obtener la descripción del árbol,
deberemos realizar otro join contra la tabla árbol. El resultado obtenido son los árboles pino,
encina y roble.
• El número de aves que son migratorias. Para ello deberemos contar todas las filas de la tabla
ave, cuyo atributo migratoria tenga el valor true.
201
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• El nombre de las aves que anidan en árboles de hoja caduca ordenados alfabéticamente. Lo
que debemos hacer es seleccionar primero todas las filas cuyo atributo tipo_hoja para luego
hacer el join de estas filas con la tabla ave_arbol por el campo cod_arbol, para obtener así el
código de las aves que anidan en dichos árboles. Acto seguido, si queremos obtener el nombre
de las aves, deberemos realizar un join de las filas obtenidas, con la tabla ave, por el atributo
cod_ave y proyectar sobre nombre. La anterior explicación se resume en la sentencia mostrada
en el Código fuente 212.
Como resultado del Código fuente 212, obtenemos que dichas aves corresponden al mirlo blanco y
al pato salvaje
Si ahora queremos consultar todas las aves que son migratorias, podemos aprovechar la vista anterior,
para hacerlo ejecutamos el Código fuente 213.
202
Presente y futuro de las bases de datos
La evolución de las bases de datos en los últimos años, ha permitido el afianzamiento de un modelo
que se ha tomado como base de la práctica totalidad de los SGBD existentes en la actualidad, el
modelo relacional. Sin embargo, no ha sido sino hasta hace unos pocos años cuando este modelo vio la
luz, como consecuencia de una necesidad de simplificación de los primeros modelos que se usaron
como base.
Como ya se ha comentado, los primeros modelos que surgieron fueron el jerárquico y el modelo en
red. El primero nació como una conceptualización de la forma de entender las relaciones entre los
objetos, es decir, una clasificación natural, que permitía navegar entre ellos para obtener la
información que se necesitaba.
Para que el lector lo comprenda mejor, era una especie de clasificación del modo “pais – comunidad –
provincia – localidad” o “empresa – departamento – empleado”. Las relaciones entre los objetos se
establecían de una manera natural, mediante referencias a los mismos.
El modelo en red nació como una ampliación del modelo jerárquico, en el cual ya no se tienen árboles,
sino grafos, lo cual dificulta ampliamente la definición y el manejo del esquema. Sería algo del estilo
“empresa – empleado – empresa ...”.
Sin embargo, la evolución de estos modelos, dieron lugar a uno nuevo, el relacional, cuya simplicidad
y potencia revolucionaron el mercado de las bases de datos. A pesar de ello, la evolución siguió otra
rama alternativa, dando lugar a las denominadas bases de datos orientadas a objetos. Aunque fueron
muchos los que apostaron por éstas, la realidad es que en la actualidad su uso no supera el 5% de la
cuota de mercado con respecto al modelo relacional.
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Debido a lo anterior, fueron muchos los que pensaron que no sería mala idea unir lo mejor de ambos
modelos: el relacional y el orientado a objetos. Así nace el modelo objeto-relacional. Tomando como
base el relacional, une a éste la funcionalidad que ofrece la orientación a objetos. De esta forma se
tienen relaciones en forma de tablas, cuyos atributos pueden ser a su vez referencias a objetos, además
de incorporar sus propios métodos. Por ejemplo, se puede tener el atributo domicilio que se puede
descomponer en calle, provincia y localidad, que tendría el método alta(), que se ejecutaría cada vez
que se da de alta un nuevo domicilio.
Como el lector ya habrá podido comprobar, en estos modelos ni siquiera se cumple la 1FN, lo cual
desbarata prácticamente todo el proceso de normalización. Además, se necesitará un lenguaje especial
para definir y manejar la información. Surge entonces el SQL:1999 como lenguaje estándar para el
acceso y definición de este tipo de esquemas.
Por otro lado, no paran de surgir nuevos estudios y propuestas de modelos que amplían los ya
existentes. Así por ejemplo, podemos encontrar bases de datos espaciales (para manejo de información
en tres dimensiones), bases de datos fuzzy (o que manejan información imprecisa, como por ejemplo
alto, joven, caro, y que ya disponen de su propio lenguaje), y así un sinfín de posibilidades.
Sin embargo, lo que más expectación esta suscitando actualmente, y que se prevé tenga un mayor
impacto si cabe, en un futuro no muy lejano, es el data warehousing y el data mining.
Por data warehousing se entiende el almacenamiento masivo de los datos que gestiona una empresa,
que debido al avance y mejora de los SGBD actuales, permite una mejor gestión de los mismos. Así
por ejemplo, cabe imaginar, por ejemplo, una empresa que dispone de cantidades ingentes de
información (empleados, clientes, proveedores, ventas, compras), que en un principio es gestionada
desde ámbitos distintos, y puede no tener relación ninguna entre sí (cada departamento manejaría
únicamente la información relevante al mismo). Pues bien, el concepto de data warehousing (en lo
sucesivo DW) se refiere a la posibilidad de integrar toda esta información, que aparece dispersa en el
ámbito del negocio, para su mejor gestión, de una forma más eficaz y eficiente, de tal manera que
dicha información pueda ser utilizada más provechosamente.
De esta forma se puede obtener, mediante herramientas específicas (OLAP, ROLAP, etc.) información
de una manera más útil. Por ejemplo, se pueden utilizar los denominados data marts, que son una
especie de vistas con la información que interesa obtener, con la peculiaridad que el acceso se realiza
en varias dimensiones de una forma más eficaz (por ejemplo las ventas por proveedores en cada
región).
En cambio, este proceso, como puede imaginar el lector, es una tarea ardua, tediosa y difícil, que
implica una carga, filtrado y proceso de los datos, para evitar incoherencias, duplicidades e
información irrelevante, y se resume en la Figura 96.
Una vez que se tiene el DW, se pueden aplicar procesos que permitan una obtención de información
añadida, que no aparece de manera explícita en el mismo. Una de las técnicas más importantes de
extracción de información es la denominada data minning o minería de datos (en lo sucesivo DM).
Como su propio nombre indica, consiste en la navegación a través de los datos para inferir
conocimiento mediante técnicas de Inteligencia Artificial, que no se encuentra de manera explícita.
Esta técnica es muy útil sobre todo en el ámbito del marketing y publicidad, para obtener, por ejemplo,
posibles clientes potenciales para una campaña comercial, o personalizar el tipo de información que un
cliente puede recibir, entre otras.
204
© Grupo EIDOS 24. Presente y futuro de las bases de datos
Figura 96
Ya existen en el mercado varios productos que soportan tanto el DW como el DM, pero que, debido a
su elevado precio, hacen que todavía sea un mercado que no se encuentre al alcance de todo el mundo,
pero que se espera crezca positivamente en un futuro no muy lejano.
Sin embargo, SQL Server 2000 ya nos permite adentrarnos es este mundo, ofreciéndonos diversas
posibilidades de las ya mencionadas, como resume la Figura 97.
Figura 97
205
Diseño conceptual con Power Designor
Introducción
Empezaremos dando respuesta a la pregunta "¿qué es Power Designor?". Pues bien, se puede
decir que Power Designor es una herramienta CASE para el diseño de bases de datos. Una
herramienta CASE es aquella que permite al usuario la realización de unas determinadas tareas de
forma fácil y precisa. En nuestro caso, Power Designor permite al usuario establecer el diseño de un
esquema relacional, de forma clara y sencilla, evitándole tareas engorrosas, como el paso del diseño
conceptual al físico, etc.
Power Designor abarca dos de las tres grandes etapas del diseño de un esquema relacional:
1. El diseño conceptual
2. El diseño físico
El diseño conceptual permite establecer la definición de las tablas, las relaciones entre éstas y su
cardinalidad, los atributos y sus tipos, las claves, etc., mientras que el diseño físico comprende la
definición de índices, la redundancia controlada de datos, y en general todos los aspectos relacionados
con esta fase de diseño. Además nos permite pasar fácilmente del esquema conceptual, al esquema
físico, y realizar ingeniería inversa, es decir, obtener el esquema conceptual de una base de datos, con
sólo conocer su esquema físico. Y no solo esto, sino que también se ofrece la posibilidad de generar un
script (trozo de código) que es capaz de crear el esquema físico para una plataforma y un SGBD
concreto.
1. Extensión CDM: contiene la definición del esquema conceptual (Conceptual Data Model)
2. Extensión PDM: contiene la definición del esquema físico (Physical Data Model)
Figura 98
Para crear una nueva entidad, se deberá pulsar el botón de creación de entidades, y hacer click con el
botón izquierdo del ratón en cualquier parte de la pantalla. Una vez que tengamos creada la entidad, se
deberán definir sus propiedades, es decir, su nombre, atributos y tipos, claves de la entidad, etc. Para
ello tenemos dos formas: pulsar el botón de definición de entidades y hacer click izquierdo sobre la
entidad, o hacer doble click sobre dicha entidad. La pantalla que nos aparece se muestra en la Figura
99.
En ella se deberá teclear el nombre que le demos a la entidad, un código que representará de manera
unívoca a la entidad, y se deberá especificar si la entidad generará tabla en el esquema físico. Pulsando
el botón Rules se podrán definir las Bussiness Rules o Reglas de Negocio, es decir, las
208
© Grupo EIDOS Apéndice A. Diseño conceptual con Power Designor
restricciones que determinar el comportamiento de las entidades y/o sus relaciones. "Un cliente no
puede pedir un crédito superior a 1.000 euros" o "un proveedor sólo puede atender a un cliente" son
ejemplos de reglas de negocio. En este apartado también se definen las reglas de integridad
referencial.
Figura 99
• Validación: Especifican las restricciones que puede tener un valor en el esquema. Ej: el
crédito de un cliente no puede superar el 20% de su compra.
• Hecho: Describen los hechos o forma de funcionar de la empresa. Ej: un cliente puede
realizar uno o más pedidos.
• Fórmula: Definen los cálculos a realizar en el sistema de información. Ej: la suma total de los
pedidos realizados por un cliente.
La pantalla para la asignación de reglas de negocio a una entidad aparece en la Figura 100
Para añadir una regla, bastará con pulsar el Botón Add... y nos aparecerá una lista con todas las reglas
definidas. Si todavía no se ha introducido ninguna, será preciso pulsar el botón List... para hacerlo. La
pantalla que nos permite definir las reglas de negocio es la que se muestra en la Figura 101.
Si queremos introducir una nueva regla, habrá que pulsar el botón New, especificar el nombre y el
código de la regla, y el tipo de ésta. Pulsando el botón Define se visualizará la siguiente pantalla, en la
209
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
que podremos teclear la descripción de la regla o la formula aplicable, dependiendo del tipo de regla
que hayamos escogido. Además se puede especificar si la expresión a evaluar se desea ejecutar en el
cliente o en el servidor.
Figura 100
Figura 101
210
© Grupo EIDOS Apéndice A. Diseño conceptual con Power Designor
Figura 102
Volvemos a la pantalla de definición de entidades para determinar los atributos de la entidad, para lo
cual pulsamos el botón Atributtes. Se mostrará entonces una nueva ventana, cuyo aspecto se muestra
en la siguiente figura, en la que podremos incluir nuevos atributos para dicha entidad. Para ello se
dispone de dos opciones:
2. Pulsar el botón Add... lo cual permitirá seleccionar un atributo de entre los ya existentes en el
sistema de información.
Figura 103
211
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
De esta pantalla cabe destacar dos cosas. Una es la posibilidad de determinar un atributo como
identificador (identifier), es decir, ese atributo será clave para dicha entidad, o como obligatorio
(mandatory) en cuyo caso dicho campo deberá tener siempre un valor no nulo. Recuérdese que un
valor nulo no es ni el cero ni el espacio en blanco, simplemente es un valor que no tiene valor (valga la
redundancia). La segunda es el tipo de atributo. Power Designor nos permite escoger entre una amplia
gama de tipos de datos, dejando al usuario la posibilidad de especificar su longitud y precisión. Dichos
atributos serán traducidos a los tipos específicos del SGBD con el que se vaya a trabajar (recordar
que en la definición del esquema conceptual no se tiene por qué saber la implementación física que se
va a realizar). Dentro de esta pantalla también se puede especificar el dominio de un atributo, es decir,
el rango de valores que puede tomar. En la lista desplegable etiquetada como Domain se puede
seleccionar el dominio que se va asignar a ese atributo. En el caso de que no tengamos definido ningún
dominio todavía, se podrá acceder a la pantalla que permite hacerlo, pulsando el botón .... Ésta tiene
un aspecto muy parecido al de todas las pantallas de definición vistas hasta ahora.
Figura 104
Para incluir un nuevo dominio, se deberá pulsar el botón New e introducir el nombre, código y tipo de
dato de éste. La definición en si del dominio se establece al pulsar el botón Check en el que se
mostrará una nueva pantalla, como la Figura 105, que permite establecer las principales características
del dominio.
En la carpeta de Standard Parameters es donde se especificará el rango que tomará el atributo. En este
caso se ha introducido un dominio para los números telefónicos, que variará entre 600.000.000 (para
los móviles) y 999.999.999 (para los fijos), también se puede introducir directamente la lista de
valores que puede tomar, introduciéndolos en la lista de la derecha, e introducir otro tipo de
restricciones como son el caso de las mayúsculas o minúsculas en los caracteres, o no permitir la
modificación del atributo.
En la carpeta de Validation Rules (Figura 106), es donde se permite la definición de restricciones mas
especificas. En nuestro caso se ha optado por la expresión ofrecida por defecto.
Se ha visto hasta ahora que en la mayoría de las pantallas aparecen dos botones (o carpetas) con los
nombres Description y Annotation. La utilidad de ambos es la de disponer de un editor que permite la
introducción de textos explicatorios y/o aclaratorios, en las definiciones de atributos, entidades y otros.
212
© Grupo EIDOS Apéndice A. Diseño conceptual con Power Designor
Figura 105
Figura 106
Creación de relaciones
Se hablará en este apartado de las relaciones entendidas como la "unión" o relación entre dos
entidades. Para crear una relación entre dos entidades pulsaremos el botón de relación entre entidades
de la paleta de herramientas. Acto seguido haremos click derecho con el ratón en la entidad origen y,
213
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
sin soltarlo, lo moveremos hasta la entidad destino. La Figura 107 muestra la relación existente entre
las entidades cliente y proveedor.
Figura 107
Una vez definida la relación, el siguiente paso es establecer la cardinalidad de la misma. Nuevamente,
para obtener el cuadro de diálogo de definición de propiedades, haremos doble click sobre la relación,
obteniendo algo parecido a la Figura 108.
Figura 108
Es aquí donde se deberá establecer la cardinalidad máxima y mínima de la relación en ambos sentidos.
Por ejemplo, podemos decir que un proveedor puede distribuir a uno o más clientes. Es decir, cada
ocurrencia de la entidad proveedor puede relacionarse con una (cardinalidad mínima) o varias
(cardinalidad máxima) ocurrencias de la entidad cliente. En el sentido contrario, un cliente sólo puede
abastecerse de un proveedor, lo que implica cardinalidad mínima y máxima uno.
Para establecer la cardinalidad máxima, se dispone de unos botones de selección, bajo el nombre de
Cardinality. Si escogemos la opción One, estamos diciendo que la cardinalidad máxima será uno,
mientras que si se selecciona la opción Many, se estará indicando que la cardinalidad máxima es
muchos (o N). Para determinar la cardinalidad mínima, se dispone de otros botones de selección, bajo
214
© Grupo EIDOS Apéndice A. Diseño conceptual con Power Designor
el nombre Existence. Si indicamos la opción Optional, quiere decir que la cardinalidad mínima es
cero, mientras que si se escoge la opción Mandatory se obliga a que la cardinalidad mínima será uno.
Nuevamente nos encontramos en esta ventana con el botón Rules, en el cual podremos establecer las
reglas de negocio, además de disponer de otras dos carpetas para introducir cualquier descripción que
se nos ocurra.
La relación de herencia
Otro tipo especial de relación es la relación de herencia. Consiste en la propiedad que tienen algunas
entidades de heredar el comportamiento de otras. Por ejemplo, podemos tener tres entidades:
automóvil con los atributos marca, modelo, precio y num_puertas, la entidad motocicleta con los
atributos marca, modelo, precio y cilindrada y la entidad bicicleta con los atributos marca, modelo,
precio y num_cambios. Pero si nos damos cuenta, las tres relaciones tienen tres atributos en común,
marca, modelo y precio. Podemos aprovechar esta ventaja para definir una relación de herencia,
suponiendo que estas son características básicas de cualquier vehículo. De esta forma se tendrá una
relación vehículo con los atributos marca, modelo y precio, de las que heredarán las entidades
automóvil con atributo num_puertas, motocicleta con atributo cilindrada y bicicleta con atributo
num_cambios. Ni que decir tiene, que estas relaciones, con atributos privados o específicos a cada
una, heredan o importan los atributos de la entidad padre. El ejemplo se representa como indica la
Figura 109.
Figura 109
Para establecer una relación de herencia, se deberá escoger en la paleta el botón relación de herencia,
seleccionar una relación, pinchar en la relación padre, y a continuación pinchar en las demás
relaciones llevándolas hasta el punto de unión.
215
Diseño físico con Power Designor
Para generar el esquema físico a partir del conceptual, se puede seleccionar la opción de menú
Dictionary - Generate Physical Model o pulsar las teclas Ctrl-G. Automáticamente aparece una
pantalla, como la mostrada en la Figura 110.
En la parte superior se especifica el SGBD específico sobre el cual se generará el esquema físico. Esto
es importante, sobre todo, para determinar las restricciones del SGBD, los tipos de datos del mismo,
etc. Justo debajo se nos preguntará por el nombre del fichero en el que se guardará el modelo físico,
con extensión .PDM. En la carpeta Generation se nos sigue preguntando una serie de parámetros. Por
ejemplo, permite especificar el nombre de los índices primarios y ajenos (campos que son clave en
otras entidades) que se generarán para cada tabla. También se puede decir si las reglas de actualización
o de borrado se propagarán a todas las tablas o sólo a la que afecte, etc. En la segunda carpeta se nos
da la opción de preservar ciertos cambios, como por ejemplo los gráficos, las etiquetas, o las reglas de
negocio.
Una vez que estemos seguros de haber dado las opciones correctas, pulsaremos el botón OK y, tras un
breve período de tiempo nos aparecerá un mensaje con el resultado de la generación; si algo ha
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 110
Figura 111
218
© Grupo EIDOS Apéndice B. Diseño físico con Power Designor
Una vez generado el esquema físico, podremos adecuarlo a nuestro gusto, teniendo en cuentas las
necesidades del sistema, y las restricciones del SGBD. De esta manera será preciso realizar un estudio
detallado de las consultas que se realizarán a la base de datos, de la velocidad del hardware, del
número de actualizaciones, etc., para de esta forma, conseguir una mayor eficiencia.
En este caso ya podemos hablar de tablas, es decir, de la concreción física de las entidades diseñadas
en el esquema conceptual. Podemos empezar modificando las características de las tablas, para lo que
será necesario hacer doble click sobre una de ellas, apareciéndonos la Figura 111.
Columnas
La edición de columnas consiste en borrar, insertar y/o cambiar la definición uno o más atributos de
las tablas. La forma de hacerlo es similar a la pantalla mostrada en el anterior tema acerca de la
definición de atributos, salvo que en esta se puede determinar un atributo como clave ajena (atributo
que es clave en otra tabla).
Otra funcionalidad que ofrece Power Designor es la definición de atributos extendidos, que permite la
determinación de ciertas características correspondientes a los atributos de una tabla, como pueden ser
la forma de visualización (lista desplegable, editor, etc.), el valor inicial o por defecto del mismo,
etiquetas, cabeceras, comentarios que se mostrarán a la hora de visualizarlos, etc. A esta funcionalidad
se accede pulsando el botón Extended, ante el cual aparece la Figura 112.
Figura 112
Indices
La definición de los índices de una tabla es otra de las características del diseño físico ya estudiadas,
cuyo cometido es el aumento de eficiencia a la hora de realizar las consultas. Recuérdese, sin
219
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
embargo, la desventaja que supone el tener una tabla de índices demasiado extensa, a la hora de
realizar actualizaciones. Por lo tanto, es preciso realizar un estudio detallado de las transacciones que
se darán en la base de datos.
Para acceder a la pantalla de definición de índices, se deberá pulsar el botón Indexes. Dicha pantalla
tiene la apariencia de la Figura 113.
Figura 113
Para definir un nuevo índice, pulsaremos el botón New, teclearemos su nombre, y especificaremos su
tipo, de entre los siguientes:
• Primary key: índice por clave primaria. Es el índice que se seguirá por defecto, y define los
atributos que son clave en la tabla.
• Foreign key: es el índice que hace referencia a campos de la tabla, que son clave en otra tabla.
• Unique: índice único, es decir, sus campos no pueden tener valores duplicados.
• Cluster: índice cluster, usado para recorrer los cluster de una base de datos (se remite al lector
al capítulo de diseño físico).
Para añadir campos a un índice, se pulsará el botón Add y se seleccionarán los atributos que se desean
añadir. Además se puede especificar la ordenación del índice, que puede ser ascendente o descendente.
En el botón Alternate Keys se pueden especificar claves alternativas o secundarias. Este es otro tipo de
claves, además de las primarias, que sirven para identificar una ocurrencia de una entidad en la base de
datos.
220
© Grupo EIDOS Apéndice B. Diseño físico con Power Designor
Atributos extendidos
Como ya se ha visto, la funcionalidad que ofrece Power Designor sobre atributos extendidos, permite
la modificación de ciertas características de éstos.
Sin embargo, pulsando el botón Extended, nos podemos encontrar con otra pantalla, totalmente
distinta a la mostrada anteriormente, pero cuya finalidad es la misma: modificar el aspecto de
visualización de estos atributos, y cuyo aspecto es el mostrado en la Figura 114.
Figura 114
Como se puede observar, en ella no se pueden definir formas de visualización de los atributos, ni
valores iniciales, ni nada por el estilo, pero nos permite establecer las fuentes (tipo de letra, tamaño,
estilo, etc.) con las cuales se mostrarán las tablas.
Triggers
Como su propio nombre indica, los triggers son disparadores, es decir, trozos de código que se
ejecutan cuando ocurre un determinado evento.
En esta funcionalidad, accesible mediante el botón Triggers, se pueden determinar las acciones que
tendrán lugar cuando ocurra un determinado evento, como por ejemplo, al insertar una tupla en la base
de datos. Este código es dependiente del SGBD, y define la acción que tendrá lugar ante ciertos
eventos.
221
Bases de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 115
Restricciones
Bajo el nombre restricción, se agrupa todo un conjunto de funciones que define el rango de valores
que puede tomar un determinado atributo, y todas las reglas que debe verificar una tabla. No se
ahondará más en este tema, ya que ya se ha estudiado en el capítulo sobre diseño conceptual, y cuyo
comportamiento es similar en el diseño físico.
Creación de vistas
Se entiende por vista, una porción de la base de datos, accesible por un usuario. Recuérdese la
definición de vista recogida en el capítulo de introducción, y cuyo conjunto correspondía a la
definición del nivel externo de la base de datos. Una vista permite la introducción de un nivel de
seguridad. Es decir, se definirán consultas, que afecten a un determinado número de tablas, y cada una
de ellas podrá ser accedida por uno o varios usuarios. Si no queremos que un usuario acceda a una
determinada tabla, simplemente se le ofrecerán vistas que no impliquen dicha tabla.
Para definir una vista en Power Designor, pulsaremos el botón y a continuación pincharemos en
cualquier punto de la pantalla. Para editarla, bastará con hacer doble click sobre ella, y nos aparecerá
una pantalla como la que aparece en la Figura 116.
En ella podemos definir las tablas que implica, pulsando el botón Tables, y la query o consulta,
pulsando el botón Query. Además se puede dar la opción de modificar el contenido de las tablas
(opción Updatable) o simplemente consultar (opción Query Only). La query se podrá definir mediante
el lenguaje SQL, pulsando el botón con dicho nombre.
222
© Grupo EIDOS Apéndice B. Diseño físico con Power Designor
Figura 116
223
Ejemplo de diseño con Power Designor
Para irnos familiarizándonos con el uso de S-Designar, vamos a tratar de resolver un planteamiento
utilizando esta herramienta.
Enterprise SL es una empresa de venta al público, quiere informatizar su sistema, de cara al euro y al
año 2000. Para ello nos ha encargado que diseñemos una base de datos que permita la introducción y
recuperación eficiente de datos. El funcionamiento de Enterprise SL es el siguiente. Existen una serie
de proveedores que abastecen a dicha empresa. A su vez, Enterprise SL desea tener almacenados los
datos de todos sus clientes. Por otra parte, de cara a Hacienda, desea simplificar el tema de la
facturación. Para ello desea tener almacenados todos los pedidos. Además desea conocer en todo
momento la disponibilidad de productos en el almacén, para realizar pedidos de forma automática,
cada vez que las existencias son inferiores a las 10 unidades de cada producto.
Lo primero realizar es un diseño del esquema conceptual. Para ello abrimos la utilidad DataArchitect
de S-Designar, y creamos un nuevo modelo conceptual (.CDM). A continuación empezamos a definir
entidades:
• Proveedor: nos interesa saber su código de proveedor, nombre, CIF, dirección, ciudad y
provincia.
• Cliente: de que se desea conocer su código de cliente, NIF, nombre, apellidos, dirección,
ciudad, provincia y teléfono.
Empezamos creando las entidades. Pulsamos el botón entidad en la paleta de componentes y acto
seguido pulsamos seis veces en cualquier punto de la pantalla. Ya tenemos creadas las seis entidades.
El siguiente paso es definir los atributos de cada una de ellas. Para quitar la selección se puede pulsar
el botón flecha en la paleta, o hacer click con el botón derecho del ratón. Empezaremos por la entidad
proveedor. Para ello hacemos doble click sobre cualquiera de las entidades y, en la ventana que nos
aparece teclearemos el nombre de la entidad (Proveedor), y acto seguido pulsamos el botón
Attributes. Para crear un nuevo atributo pulsamos el botón New y le damos un nombre (CIF), un
código (que será también CIF) y un tipo de dato (tipo carácter de longitud 10, A10). Así procederemos
con el resto de atributos, teniendo en cuenta que la clave de dicha entidad será el atributo
cod_proveedor, por lo que tacharemos la caja de selección correspondiente a Identifier de dicho
atributo. La definición completa es la mostrada en la
Figura 117
Nos decantaremos por esta última opción, ya que evitará el tener diferentes definiciones para una
misma ciudad (Ej.: Sta. Cruz Tenerife, Santa Cruz de Tenerife, Sta. Cruz Trfe., Etc.). Esto implica la
creación de otras dos nuevas entidades:
226
© Grupo EIDOS Apéndice C. Ejemplo de diseño con Power Designor
Por lo tanto creamos dos entidades más, siguiendo el mismo proceso indicado anteriormente. En la
Figura 118 mostraremos como quedaría la pantalla de definición de la entidad provincia.
Figura 118
El atributo cod_provincia será la clave de la entidad, y será de tipo numérico de dos dígitos. El atributo
desc_provincia será un texto de 20 caracteres.
Figura 119
227
Base de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Figura 120
Lo único a destacar aquí es la clave de la entidad, que es el atributo cod_cliente, y los atributos
obligatorios que son Nombre y Apellidos.
Figura 121
228
© Grupo EIDOS Apéndice C. Ejemplo de diseño con Power Designor
Figura 122
Figura 123
En esta última definición, cabe destacar que se ha optado por no almacenar el importe en euros en un
nuevo campo, ya que ello supone un desperdicio de memoria, máxime cuando se sabe el cambio de
pesetas a euros. Lo único que se deberá realizar para calcularlo será dividir el importe en pesetas por
166,386, con lo que ya tenemos una regla de negocio para la entidad factura. Para crearla, pulsamos el
229
Base de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
botón Rules, y en la pantalla que nos aparece pulsamos List. Le damos el nombre Pesetas_a_euros,
y decimos que es de tipo Formula. Para definirla, pulsamos el botón Define y tecleamos lo que
muestra la Figura 125.
Figura 124
Figura 125
Una vez definida, sólo nos queda añadirla a la entidad, para lo que pulsaremos el botón Add en la
pantalla y escogeremos dicha regla.
230
© Grupo EIDOS Apéndice C. Ejemplo de diseño con Power Designor
Figura 126
Una vez definidas todas las entidades, el siguiente paso es crear las relaciones entre ellas. Podemos
observar varias relaciones entre pares de entidades:
Figura 127
231
Base de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• Un cliente puede realizar muchos pedidos, pero un pedido sólo puede ser realizado por un
cliente. Esto implica una relación 1-N, y la ventana queda como la Figura 128.
Figura 128
• Un pedido puede tener muchas líneas de pedido, pero una línea de pedido sólo puede
corresponder a un pedido. Además, la relación en el sentido de linea_pedido es dependiente,
es decir, no se puede identificar una línea de pedido, si no se sabe el pedido al que
corresponde.
Figura 129
232
© Grupo EIDOS Apéndice C. Ejemplo de diseño con Power Designor
• En una línea de pedido sólo puede haber un producto, mientras que un producto puede estar en
varias líneas de pedido.
Figura 130
• Un cliente puede tener varias facturas, sin embargo una factura sólo puede corresponder a un
cliente.
Figura 131
233
Base de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
• Una provincia puede tener muchas ciudades, pero como mínimo una, y una ciudad sólo puede
pertenecer a una provincia.
Figura 132
• Una ciudad puede tener varios proveedores, pero un proveedor sólo puede pertenecer a una
ciudad. La cardinalidad mínima es uno, ya que no nos interesa tener almacenadas las ciudades
sin proveedores.
Figura 133
234
© Grupo EIDOS Apéndice C. Ejemplo de diseño con Power Designor
• Una ciudad puede tener varios clientes, pero un cliente sólo puede pertenecer a una ciudad.
Obsérvese, en la Figura 134 como no se ha incluido una relación entre provincia y cliente, ya
que sabiendo la ciudad a la que pertenece el cliente, podemos saber su provincia.
Figura 134
Pues bien, ya tenemos el esquema conceptual, que queda como muestra la Figura 135.
Figura 135
235
Base de datos con SQL Server 2000 – Transact SQL © Grupo EIDOS
Una vez obtenido el esquema conceptual, el siguiente paso es obtener el esquema físico. Para ello
pulsamos Ctrl-G y escogemos un SGBD, por ejemplo Microsoft Access 95. Pulsamos Ok. El esquema
físico queda como aparece la Figura 136.
Figura 136
En él podemos observar como se ha añadido una nueva relación, denominada RELATION_63, fruto
de la relación N-M entre las entidades producto y proveedor, y que almacena los productos que han
sido abastecidos por cada proveedor. Las flechas representan las operaciones de join que hay que
realizar para obtener la información de una tabla.
Figura 137
236
© Grupo EIDOS Apéndice C. Ejemplo de diseño con Power Designor
Lo primero que realizaremos será cambiar el nombre de la relación RELATION_63, ya que no queda
muy estético. Le daremos el nombre de Proveedor-Producto, y añadiremos un nuevo atributo, que será
la fecha en la que se ha realizado la venta. Para ello hacemos doble click en dicha entidad, pulsamos el
botón Columns, pulsamos el botón New, y tecleamos el nuevo atributo.
Crearemos ahora una vista, para que la secretaria encargada de realizar los pedidos, compruebe el
stock que queda. Para ello pulsamos el botón vista en la paleta de componentes, y pinchamos en
cualquier punto de la pantalla. Para definirla, hacemos doble click sobre ella, y establecemos una
consulta SQL.
Figura 138
237
Si quiere ver más textos en este formato, visítenos en: http://www.lalibreriadigital.com.
Este libro tiene soporte de formación virtual a través de Internet, con un profesor a su
disposición, tutorías, exámenes y un completo plan formativo con otros textos. Si desea
inscribirse en alguno de nuestros cursos o más información visite nuestro campus virtual en:
http://www.almagesto.com.
Si quiere información más precisa de las nuevas técnicas de programación puede suscribirse
gratuitamente a nuestra revista Algoritmo en: http://www.algoritmodigital.com. No deje de
visitar nuestra reviata Alquimia en http://www.eidos.es/alquimia donde podrá encontrar
artículos sobre tecnologías de la sociedad del conocimiento.
Si quiere hacer algún comentario, sugerencia, o tiene cualquier tipo de problema, envíelo a la
dirección de correo electrónico lalibreriadigital@eidos.es.
© Grupo EIDOS
http://www.eidos.es