13

SISTEMAS
& TELEMÁTICA
Propuesta de un método para el diseño
y modelado de una bodega de datos
José Hernando Bahamón L.
Universidad Icesi
jbahamon@icesi.edu.co
RESUMEN
El desarrol l o de l os Si stemas de I n-
formaci ón Gerenci al basados en tec-
nol ogí as de Data Warehouse y Herra-
mi entas Ol ap, es rel ati vamente re-
ci ente y, por l o tanto, no exi ste una
pr opuesta metodol ógi ca uni ver sal -
mente vál i da y aceptada como tal , por
l a comuni dad académi ca.
El presente artí cul o expone una pro-
puesta metodol ógi ca para l a real i za-
ci ón del di seño de una bodega de da-
tos, que uti l i za como eje arti cul ador
l a i denti fi caci ón de l as necesi dades de
i nformaci ón por parte de l a gerenci a,
para el soporte de l os procesos de con-
trol y de toma de deci si ones.
El método propuesto está compuesto
de ocho pasos agrupados en tres fa-
ses. La pr i mer a fase compr ende l a
i denti fi caci ón de l as necesi dades de
i nformaci ón gerenci al , desde l a pers-
pecti va del negoci o. La segunda fase
comprende todas l as acti vi dades re-
l aci onadas con l a el aboraci ón de un
model o l ógi co-conceptual de l a estruc-
tura de l a bodega de datos. La terce-
ra fase i ncl uye l os pasos para real i -
zar el di seño fí si co de l a estructura
de l a bodega de datos.
PALABRAS CLAVES
Bodegas de datos, método de di seño
de l a estr uctur a de una bodega de
datos.
ABSTRACT
The devel opment of Management I n-
for mati on Systems based on War e-
Fecha de recepción: 15-4-2003 Fecha de aceptación:25-8-2003
14
SISTEMAS
& TELEMÁTICA
house Data technol ogi es and Ol ap
tool s i s rel ati vel y new. Therefore, the-
re i s no val i d methodol ogi cal appro-
ach that i s general l y accepted as such
by the academi c communi ty.
Thi s arti cl e presents a methodol ogi -
cal approach to the desi gn of a data
warehouse usi ng the i denti fi cati on of
management i nfor mati on r equi r e-
ments as a shaft that supports the
control and deci si on-maki ng proces-
ses. The suggested approach consi sts
of ei ght steps grouped i n three di ffe-
rent stages. The fi rst stage encompas-
ses the i denti fi cati on of management
i nformati on requi rements from a bu-
si ness per specti ve. The second one
deal s wi th al l the acti vi ti es associ a-
ted wi th the preparati on of a l ogi cal
conceptual model for the data ware-
house structure, and the thi rd stage
i ncl udes the steps to make the phy-
si cal desi gn of the data warehouse
structure.
KEY WORDS
Data war ehouses, appr oach to the
desi gn of a data war ehouse str uc-
tur e.
Clasificación: A
15
SISTEMAS
& TELEMÁTICA
INTRODUCCIÓN
El desarrol l o de l os Si stemas de I n-
formaci ón Gerenci al basados en tec-
nol ogí as de Data Warehouse y herra-
mi entas Ol ap, es rel ati vamente re-
ci ente y, por l o tanto, no exi ste una
pr opuesta metodol ógi ca uni ver sal -
mente vál i da y aceptada como tal , por
l a comuni dad académi ca.
Entre l as propuestas más conoci das
están: 1. Ral ph Ki mbal l ,
1
con un es-
quema centrado en l a i denti fi caci ón
de l os procesos de l a empresa, como
el emento cl ave para l a defi ni ci ón de
l a estructura de vari abl es y di men-
si ones; 2. W.H. I nmon,
2
con un esque-
ma que parte de l a construcci ón del
model o de datos corporati vos, el abo-
rado al más al to ni vel de abstracci ón,
para l uego deri var l a estructura del
model o de datos, para el di seño de l a
bodega; 3. Gol far el l i Matteo, Mai o
Dar i o, Ri zzi Stefano
3
pr oponen un
esquema que parte de l os model os E-
R descri pti vos de l os si stemas tran-
sacci onal es de l a organi zaci ón, para
l uego deri var el model o E-R de l a es-
tructura, para l a bodega de datos.
En este artí cul o se presenta una pro-
puesta de si stemati zaci ón del proce-
so de di seño de una bodega de datos,
que se aparta de l os esquemas de di -
seño referi dos, y que uti l i za como eje
arti cul ador, l a i denti fi caci ón de l a i n-
formaci ón gerenci al , para el soporte
de l os procesos de control y de toma
de deci si ones en l os ni vel es di recti -
vos de l a organi zaci ón.
MÉTODO PROPUESTO
El método de di seño propuesto está
centr ado en l a i denti fi caci ón de l a
i nformaci ón cl ave y rel evante para so-
portar l os procesos de di recci ón y de
toma de deci si ones dentro de l a orga-
ni zaci ón. Este método uti l i za, como
punto de parti da, l a i denti fi caci ón y
el model ado de: qué es lo que el
negocio está tratando de alcan-
zar, para l uego el aborar una estruc-
tura que apoye el proceso de gesti ón
haci a el l ogro de l as metas defi ni das.
Una vez que l a i nformaci ón cl ave de
apoyo a l os procesos de gesti ón y con-
trol de l a organi zaci ón ha si do i den-
ti fi cada, se i ni ci a l a el aboraci ón del
model o l ógi co-conceptual de l a estruc-
tura de l a bodega de datos, que so-
portará l as consul tas y l a expl oraci ón
de l os datos, a parti r de l os cual es se
construi rán l os i ndi cadores de gesti ón
requeri dos por l os ni vel es di recti vos
de l a organi zaci ón.
Para darl e un orden a este proceso
si stémi co de di seño, l os pasos del
método propuesto, tal como se presen-
tan en l a Fi gura 1, se han agrupado
en l as si gui entes fases:
• Fase 1: I denti fi caci ón de l as ne-
cesi dades de i nformaci ón geren-
ci al , desde l a perspecti va del ne-
goci o.
• Fase 2: El aboraci ón del model o l ó-
gi co-conceptual de l a estructura
de l a bodega de datos.
1. Ki mbal l R. The Data Warehouse Toolkit. John Wi l ey & Sons, 1996.
2. I nmon W.H. Building The Data Warehouse. QED Press /John Wi l ey & Sons, 1992.
3. Gol farel l i M., Mai o D., Ri zzi S. Conceptual Design of Data Warehouse From E/ R Schemes.
http//www.csr.uni b.i t/~gol fare/db.html , 1998.
16
SISTEMAS
& TELEMÁTICA
• Fase 3: El aboraci ón del model o fí -
si co de l a bodega de datos.
Fase 1:
Identificación de las necesidades
de información gerencial, desde
la perspectiva del negocio.
La pri mera fase, a parti r de l a cual
se real i za el proceso de di seño de l a
estructura para una bodega de datos,
comprende l a i denti fi caci ón de l as ne-
cesi dades de i nformaci ón gerenci al ,
l o que si gni fi ca hacer expl í ci tos l os
objeti vos y l os factores cl aves de éxi -
to de l a organi zaci ón, o de un área
del negoci o.
Es bastante común empezar este pro-
ceso de i denti fi caci ón y model ado
medi ante entrevi stas a l os di recti vos,
en l as cual es l a pregunta central es:
«¿Cuál es l a i nformaci ón que desea
obtener del si stema de i nformaci ón
gerenci al ?». Este enfoque puede resul -
tar muy pel i groso, si el di recti vo no
real i za un proceso si stemáti co y orde-
nado, para establ ecer sus necesi dades
de i nformaci ón, en rel aci ón con sus ac-
ti vi dades de gesti ón y control .
Una for ma or denada y si stemáti ca
para real i zar esta fase de i denti fi ca-
ci ón de l as necesi dades de i nforma-
ci ón, que soporte l os procesos de ges-
ti ón y control gerenci al , es l a apl i ca-
ci ón del enfoque de si stemas, par a
gui ar el proceso de revi si ón o defi ni -
ci ón de: 1. Los objeti vos estratégi cos
del negoci o o del área; 2. Los factores
cl ave para el l ogro de l os objeti vos de-
fi ni dos y 3. Los i ndi cadores de con-
trol , tanto de l os objeti vos como de l os
factores cl ave.
4
4. Véase Bahamón José H. Construcción de indicadores de gestión bajo el enfoque de sistemas. S&T Revi sta
de l a Facul tad de I ngeni erí a, Uni versi dad I cesi . 2003.
17
SISTEMAS
& TELEMÁTICA
Método para el di seño y model ado de una bodega de datos
Fase 1: I denti fi caci ón de l as necesi dades de i nfor-
maci ón gerenci al , desde l a perspecti va del negoci o.
Fase 2: El aboraci ón del model o l ógi co-conceptual
de l a estructura de l a bodega de datos.
2.1. Defi ni r l as tabl as de hechos o l as vari abl es de l a
estructura.
2.2. I denti fi car, para cada tabl a de hechos, l as di men-
si ones que l a referenci an.
2.3. Establ ecer el ni vel de granul aci ón y l os ni vel es de
agregaci ón.
2.4. El aborar el di agrama en estrel l a que representa
l a estructura de l a bodega.
Fase 3: El aboraci ón del model o fí si co de l a bodega
de datos.
3.1. Veri fi caci ón y ajuste del model o l ógi co.
3.2. Defi ni ci ón del esquema fí si co del al macenami en-
to de l as di mensi ones y sus jerarquí as.
3.3. Defi ni ci ón de l os atri butos que conforman l as
tabl as de hechos.
Figura 1. Método para el di seño y model ado de una bodega.
18
SISTEMAS
& TELEMÁTICA
Como resul tado de esta fase, se ten-
drá una vi si ón del negoci o y de l a i n-
formaci ón requeri da para l a di recci ón
y el control gerenci al , representada
fundamental mente por: Los objeti vos
del negoci o; l os factores cl ave de éxi -
to y, en especi al , un conjunto de i ndi -
cadores cl ave de l a gesti ón.
Fase 2:
Elaboración del modelo lógico-
conceptual de la estructura de la
bodega.
En esta fase se el abora el model o l ó-
gi co de l a estructura de l a bodega, que
soportará l as consul tas, medi ante l as
cual es se obtendrá l a i nformaci ón re-
quer i da por l os ni vel es di r ecti vos
como apoyo a sus procesos de gesti ón
y de toma de deci si ones.
La el aboraci ón de este model o l ógi co
comi enza con l os i ndi cadores de ges-
ti ón (necesi dades de i nformaci ón ge-
renci al ), i denti fi cados en l a fase an-
teri or, y termi na con l a construcci ón
de una representaci ón mul ti di men-
si onal de l as vari abl es que conforman
cada i ndi cador. En esta representa-
ci ón mul ti di mensi onal , cada vari abl e
es model ada medi ante un arregl o di -
mensi onal (mul ti di mensi onal ) de cel -
das, como se presenta en l a Fi gura 2.
Para faci l i tar el proceso de el abora-
ci ón del model o l ógi co, se uti l i za una
representaci ón gráfi ca denomi nada
di agrama ti po estrel l a, donde el el e-
mento central del esquema es l a Va-
ri abl e o Tabl a de Hechos («Fact»), l a
cual es referenci ada por un conjunto
de ejes, denomi nados Di mensi ones, a
través de l os cual es se sel ecci onan l os
val ores conteni dos en l a tabl a de he-
chos. En l a Fi gura 3, se esquemati za
el model o de un di agrama en estrel l a.
19
SISTEMAS
& TELEMÁTICA
Figura 2. Vi sta mul ti di mensi onal de una de l as vari abl es que conforman
un i ndi cador.
Figura 3. Di agrama en estrel l a de una estructura mul ti di mensi onal .
20
SISTEMAS
& TELEMÁTICA
Antes de presentar l os pasos propues-
tos por el método para l a el aboraci ón
del model o l ógi co, es perti nente pre-
ci sar al gunos de l os térmi nos uti l i za-
dos en el método pr opuesto. En el
Cuadro 1 se presentan l as defi ni ci o-
nes adoptadas par a l os di fer entes
conceptos uti l i zados en el método pro-
puesto.
Cuadro 1:Defi ni ci ón de conceptos bási cos.
Una gráfi ca es una red de nodos i nterconectados.
Una gráfi ca di recci onal es aquel l a en l a cual l a conexi ón entre
dos nodos ti ene una di recci ón especí fi ca.
Un model o E-R puede ser consi derado una gráfi ca di recci onal .
En una gráfi ca, una trayectori a ací cl i ca es aquel l a que sól o
ti ene una forma de recorri do (en un sol o senti do).
Una trayectori a cí cl i ca es aquel l a que se puede recorrer en dos
o más secuenci as di ferentes.
Es l a tabl a central de l a estructura de l a bodega. Esta tabl a
conti ene l os datos de i nterés para el negoci o, es deci r, l os val o-
res para l a construcci ón de l os i ndi cadores cl aves del negoci o.
Técni camente, l a tabl a de hechos es una enti dad de i ntersec-
ci ón cuya l l ave pri mari a está compuesta por l a uni ón de l os
domi ni os de l as di ferentes di mensi ones que l a referenci an.
Las di mensi ones corresponden a l os ejes con l os cual es se cons-
truye l a vi sta mul ti di mensi onal de l a i nformaci ón cl ave del ne-
goci o, al macenada en l a tabl a de hechos.
Las atri butos al macenados en l as di mensi ones determi nan l a
granul aci ón adoptada para el model o.
Las di mensi ones pueden ser:
– Propias: Cuando el conjunto de enti dades que conforman
l a di mensi ón se encuentran uni das a l a tabl a de hechos, en
una trayectori a ací cl i ca.
– Impropias: Cuando el conjunto de enti dades que confor-
man l a di mensi ón se encuentran uni das a l a tabl a de he-
chos, en una trayectori a cí cl i ca.
– De Información: Cuando l os atri butos conteni dos en l a
di mensi ón defi nen qué ti po de datos se encuentran al mace-
nados en l a tabl a de hechos.
Determi nan cómo l as i nstanci as de l a tabl a de hechos pueden ser
agregadas. Las jerarquías permiten las operaciones de «drill-down»
o «rol l up», en l os procesos de consul ta.
Una jerarquí a está conformada por el conjunto de enti dades
que consti tuyen l a di mensi ón.
Gráfi ca
Tr ayector i as cí cl i cas
y ací cl i cas
Tabl a de hechos
Di mensi ón
Jerarquí as
21
SISTEMAS
& TELEMÁTICA
A conti nuaci ón se presentan l os cua-
tro pasos propuestos para l a si stema-
ti zaci ón del proceso de el aboraci ón del
model o l ógi co:
Paso No. 1:
Definir las tablas de hechos o las
variables de la estructura.
Este paso se real i za a parti r del con-
junto de l os i ndi cadores de gesti ón,
defi ni dos en l a fase de i denti fi caci ón
de l as necesi dades de i nfor maci ón
ger enci al , desde l a per specti va del
negoci o. El paso se i ni ci a con l a eva-
l uaci ón de l as vari abl es (di vi sores y
di vi dendos) de cada i ndi cador, para
deter mi nar cuál es de éstas pueden
ser al macenadas en una tabl a de he-
chos, y cuál es no.
En el Cuadro 2 se presenta, a mane-
ra de ejempl o, l a i nformaci ón obteni -
da, al apl i car l os pasos de l a fase 1 al
área de ventas de una organi zaci ón.
A parti r de estos resul tados se i den-
ti fi can l as vari abl es o tabl as de he-
chos, como l o establ ece el paso 1 de
esta fase.
Apl i caci ón del paso 1: I denti fi caci ón
de l as tabl as de hechos
• El i ndi cador defi ni do para el mo-
ni tor eo del obj eti vo puede ser
construi do con una sol a tabl a de
hechos: Ventas. Se toma una sol a
vari abl e, por cuanto l as ventas del
año y l as ventas del año anteri or,
que son l as dos vari abl es que con-
for man el i ndi cador, se pueden
al macenar en l a mi sma tabl a de
hechos.
• El i ndi cador 1 del F.C.E1 puede
ser construi do con dos tabl as de
hechos que son: ventas por ven-
dedor y cuota de ventas de cada
vendedor.
• El i ndi cador 2 del F.C.E1 puede
ser construi do con dos tabl as de
hechos que son: número de vi si -
tas real i zadas por cada vendedor,
y número de vi si tas presupuesta-
das por cada vendedor.
• El i ndi cador 1 del F.C.E2 puede
ser construi do con una tabl a de
hechos: número de cl i entes nue-
vos en l a base de datos. En este
caso, el denomi nador del i ndi ca-
dor se asume como un úni co val or
y, por l o tanto, no ti ene senti do
al macenarl o en otra tabl a de he-
chos.
• Los demás i ndi cadores se anal i -
zan de i gual manera.
En suma, al real i zar el anál i si s de
todos l os i ndi cadores, obtenemos l as
si gui entes tabl as de hecho:
• Ventas.
• Ventas por vendedor.
• Cuota de ventas de cada vende-
dor.
• Número de vi si tas real i zadas por
cada vendedor.
• Número de vi si tas presupuesta-
das por cada vendedor.
• Número de cl i entes nuevos en l a
base de datos.
• Número de vendedores capaci ta-
dos que aprobaron l os cursos.
22
SISTEMAS
& TELEMÁTICA
Cuadro 2: I nformaci ón gerenci al del área de ventas,
obteni da al real i zar l a fase 1.
Área del Negocio - Descripción. Se trabaja con el área de ventas de una orga-
ni zaci ón dedi cada a l a producci ón de reci pi entes el aborados en pl ásti co.
Objetivo del Área: para propósi tos del ejempl o, se toma el si gui ente objeti vo:
Lograr al final del año un incremento del 15% en las ventas totales de la
compañía, con respecto a las ventas del año anterior.
Factores claves de éxito. Luego de real i zado el anál i si s de l as acci ones y l as
condi ci ones necesari as para garanti zar el l ogro del objeti vo pl anteado, se i denti -
fi caron l os si gui entes F.C.E:
• F.C.E.1: Pl aneaci ón y control de l a fuerza de ventas.
• F.C.E.2: Búsqueda de nuevos cl i entes rentabl es para l a organi zaci ón.
• F.C.E.3: Capaci taci ón y entrenami ento de l a fuerza de ventas.
Indicadores claves de gestión. Para el control y segui mi ento de l os F.C.E y l os
objeti vos, se proponen l os si gui entes i ndi cadores:
Ventas del año
I _obj: -1
Ventas del año anteri or
Ventas del vendedor
I 1_FCE1:
Cuota de ventas
Número de vi si tas de venta real i zadas
I 2_FCE1:
Número de vi si tas presupuestadas
Número de cl i entes nuevos en l a base de datos
I 1_FCE2:
Número de cl i entes nuevos presupuestados
Número de vendedores capaci tados que aprobaron l os cursos
I 1_FCE3:
Número presupuestado de vendedores capaci tados
23
SISTEMAS
& TELEMÁTICA
Paso No. 2:
Identificar, para cada tabla de
hechos, las dimensiones que la
referencian.
Para cada vari abl e o tabl a de hechos
se i denti fi can, con l a col aboraci ón del
usuari o l í der del área de negoci o, l os
ejes de vi sual i zaci ón mul ti di mensi o-
nal l os cual es consti tuyen l as di men-
si ones de l a vari abl e.
En este paso, se espera que el usua-
ri o vi sual i ce cada vari abl e, como un
conjunto de val ores al macenados en
una estructura de vari as di mensi o-
nes, donde l os val ores al macenados
son referenci ados por l a combi naci ón
de l os val ores defi ni dos para cada eje
(domi ni o de l a di mensi ón), tal como
se esquemati za en l a Fi gura 4.
Figura 4: Esquema de una vi sta mul ti di mensi onal de una tabl a de hechos.
Paso 3:
Establecer el nivel de granula-
ción y los niveles de agregación
de cada dimensión.
Una vez que l as di mensi ones han si do
i denti fi cadas se debe establ ecer, para
cada una de el l as, el menor ni vel de
granul aci ón, el cual corresponde al
conjunto de atri butos que referenci an
el mayor ni vel de detal l e deseado
para l a vari abl e o tabl a de hechos.
A manera de ejempl o, se apl i can l os
dos pasos anteri ores para l a Tabl a de
Hechos sobre Ventas, defi ni da en el
ejempl o anteri or.
Apl i caci ón del paso 2: I denti fi caci ón
de l as di mensi ones.
Supongamos que el gerente de ven-
tas expresa su i nterés por vi sual i zar
l a i nformaci ón de ventas organi zada
de l a si gui ente manera: pri mero, por
cada producto de l a compañí a; en se-
gundo tér mi no, por cada l ugar en
donde se venden l os productos y, fi -
nal mente, por cada semana. Podemos
establ ecer l a necesi dad de uti l i zar
24
SISTEMAS
& TELEMÁTICA
tres ejes para el aborar l a vi sta mul -
ti di mensi onal (di mensi ones) de l a
Tabl a de Hechos - Ventas:
• Di m1: Producto
• Di m2: Lugar de venta
• Di m3: Ti empo.
Apl i caci ón del paso 3: Defi ni ci ón del
ni vel de granul aci ón.
De acuerdo con l a sol i ci tud del geren-
te, se establ ece para cada di mensi ón
l a si gui ente granul aci ón:
• Dim. Producto: El menor ni vel
de granul aci ón es el Tipo de Pro-
ductos. Podemos establ ecer otros
ni vel es como: Línea de Productos,
que ti ene un ni vel de granul aci ón
mayor, pero un menor ni vel de de-
tal l e en l a vari abl e ventas; o Re-
ferencias de Productos, que ti ene
un menor ni vel de gr anul aci ón,
pero un mayor ni vel de detal l e.
• Dim. Lugar: El ni vel de granu-
l aci ón requeri do es l a Ciudad. Se
habrí an podi do sel ecci onar otros
ni vel es, como Almacén, que ti ene
un menor ni vel , o Región, que ti e-
ne uno mayor.
• Dim. Tiempo: El menor ni vel de
granul aci ón requeri do es l a Sema-
na. Se habrí an podi do sel ecci onar
otros ni vel es, como el Día, que ti e-
ne un menor ni vel , o el Mes, que
ti ene uno mayor.
Una vez se han defi ni do l os menores
ni vel es de granul aci ón para cada di -
mensi ón, se i denti fi can l os ni vel es de
agregaci ón requeri dos para l os val o-
res al macenados en l a tabl a de he-
chos, por cada di mensi ón. Estos ni -
vel es de agr egaci ón r epr esentan l a
jerarquí a de cada di mensi ón.
• J erarquía en la Dim. Produc-
to: Las ventas por productos pue-
den ser agregadas por grupos de
productos, por l í neas de produc-
tos y, por el total de l a venta. De
esta manera, l os ni vel es de agre-
gaci ón de l a di mensi ón producto
son:
– Por grupos de productos.
– Por l í neas de productos.
– Total .
• J erarquía en la Dim. Lugar:
Las ventas por l ugar pueden ser
agregadas por regi ones y por el
total del paí s.
• J erarquía en la Dim. Tiempo:
Las ventas por ti empo pueden ser
agregadas por mes, por tri mestre,
por semestre, por año.
Paso 4:
Elaborar el diagrama en estrella
que representa la estructura de
la bodega.
Luego de i denti fi car l os el ementos
que confor man l a estr uctur a de l a
vi sta mul ti di mensi onal , de l a i nfor-
maci ón ger enci al r equer i da por l a
organi zaci ón, se pasa a l a el aboraci ón
de una representaci ón gráfi ca, en for-
ma de estrel l a; para el l o se puede uti -
l i zar l a notaci ón si mpl i fi cada de l os
di agramas E-R, o l a notaci ón deno-
mi nada «Dot model i ng».
5
5. Todman, Chri s. Designing a Data Warehouse: Supporting Customer Relationship. Prenti ce Hal l , 2001.
25
SISTEMAS
& TELEMÁTICA
Notación tipo E-R:
En esta notaci ón, el di agrama en es-
trel l a está conformado por una enti -
dad central asoci ati va, que correspon-
de a l a tabl a de hechos, y por un con-
junto de trayectori as de enti dades y
rel aci ones de uno a muchos, que co-
rresponde a l as di mensi ones y a sus
jerarquí as. En l a Fi gura 5 se presen-
ta un di agrama en estrel l a con esta
notaci ón.
Figura 5. Representaci ón de un di agrama en estrel l a, medi ante l a
notaci ón ti po E-R.
Notación «Dot Modeling»
En esta notaci ón, el di agrama en es-
trel l a está conformado por una enti -
dad central que corresponde a l a Ta-
bl a de Hechos, y por un conjunto de
trayectori as compuestas por puntos
(«dots»), que representan l as di men-
si ones y sus jerarquí as. En l a Fi gura
6 se presenta un di agrama en estre-
l l a con esta notaci ón.
Figura 6. Representaci ón de un di agrama en estrel l a, medi ante l a
notaci ón «Dot Model i ng».
26
SISTEMAS
& TELEMÁTICA
A manera de ejempl o se presenta en
l a Fi gura 7, el di agrama en estrel l a,
con notaci ón «Dot Model i ng», para l a
Tabl a de Hechos y para l as di men-
si ones i denti fi cadas en el ejempl o
anteri or. En l a Fi gura 8 se represen-
tan l os mi smos el ementos de l a es-
tructura de l a bodega, pero con nota-
ci ón ti po E-R.
Figura 7. Representaci ón, medi ante l a notaci ón «Dot Model i ng», de l a
estructura para l a bodega de datos del ejempl o anteri or.
Figura 8. Representaci ón, medi ante l a notaci ón E-R, de l a estructura para
l a bodega de datos del ejempl o anteri or.
27
SISTEMAS
& TELEMÁTICA
Fase 3:
Elaboración de la estructura fí-
sica de la bodega
Durante esta fase, se real i za l a trans-
formaci ón del model o l ógi co concep-
tual en l a estructura fí si ca, que pos-
ter i or mente ser á i mpl ementada en
al guna herrami enta de «Data Ware-
house».
Este pr oceso de tr ansfor maci ón se
real i za medi ante l os si gui entes pasos:
1. Ver i fi caci ón y r efi nami ento del
model o l ógi co para determi nar su con-
si stenci a. 2. Defi ni ci ón del esquema
fí si co de al macenami ento de l as es-
tructuras jerárqui cas de l as di men-
si ones. 3. I denti fi caci ón de l os atri -
butos que confor man l as tabl as de
hechos y l as di mensi ones.
Paso 1:
Verificación y ajuste
del modelo lógico.
Durante este paso, se real i za l a veri -
fi caci ón del model o l ógi co, obteni do en
l a fase anteri or, para garanti zar que
el model o, además de soportar todas
l as consul tas requeri das por l os ni -
vel es ejecuti vos, si empre retorne i n-
formaci ón confi abl e.
Para i ni ci ar este proceso de veri fi ca-
ci ón se debe el aborar una matri z de
cr uce, entr e l os r equer i mi entos de
i nformaci ón gerenci al , defi ni dos en l a
fase i ni ci al , y l as estructuras (estre-
l l as), defi ni das en l a fase anteri or. En
l a matri z de cruce se confi rma si el
r equer i mi ento está compl etamente
soportado. Si esta veri fi caci ón no es
correcta, se debe retornar a l a fase
anteri or, para i ncorporar l as estruc-
turas que soporten l os requeri mi en-
tos fal tantes de i nformaci ón.
Ter mi nada l a r evi si ón anter i or, el
proceso conti núa con l a eval uaci ón de
l a estructura, para asegurar l a val i -
dez de todas l as consul tas de i nfor-
maci ón real i zadas sobre di cha estruc-
tura.
Para real i zar este proceso de compro-
baci ón de val i dez de l a estr uctur a,
recurri mos a l a teorí a de grafos, se-
gún l a cual una estructura de consul -
ta es vál i da cuando está conformada
por trayectori as ací cl i cas. Al apl i car
esta teor í a, se puede afi r mar que
cual qui er di seño para una bodega de
datos permi ti rá si empre consul tas co-
r r ectas, si l a estr uctur a pr opuesta
está conformada úni camente por di -
mensi ones propi as, es deci r, por tra-
yectori as ací cl i cas.
Si al real i zar l a comprobaci ón de l a
estr uctur a se encuentr an tr ayecto-
ri as ací cl i cas, éstas deben ser trans-
formadas, para asegurar l a confi abi -
l i dad de l as consul tas. Las posi bl es
transformaci ones son:
6
1. Ajuste para los casos de trayecto-
rias cíclicas simples
Este caso ocurre cuando l a trayecto-
ri a de una di mensi ón presenta una
trayectori a al terna que ti ene dos en-
ti dades comunes. En l a Fi gura 9, se
esquemati za una trayectori a cí cl i ca
si mpl e.
6. Mcguff, F. Designing the perfect Data Warehouse. 1998.
28
SISTEMAS
& TELEMÁTICA
Figura 9. Di mensi ón con trayectori a cí cl i ca.
2. Ajuste para los casos de trayecto-
rias alternas, mezcladas con trayec-
torias cíclicas.
Se presenta cuando l a trayectori a de
una di mensi ón está conformada por
una trayectori a al terna, más una tra-
yectori a cí cl i ca, tal como se esquema-
ti za en l a Fi gura 10.
Figura 10. Di mensi ón con trayectori a al terna, más trayectori a cí cl i ca.
Las opci ones de transformaci ón para
esta cl ase de trayectori as son:
• Tratar cada trayectori a como una
nueva di mensi ón, l o cual si gni fi -
ca redi bujar el di agrama, el i mi -
nando l as rel aci ones N1-A2 y A3-
N4, para l uego crear l a rel aci ón:
Tabl a de Hechos - A2.
• Converti r l a trayectori a cí cl i ca en
una trayectori a al terna, el i mi nan-
do l a rel aci ón A3-N4.
29
SISTEMAS
& TELEMÁTICA
En estos casos, el probl ema ocurre con
l a trayectori a cí cl i ca; por l o tanto, l a
transformaci ón se maneja como se ex-
pl i có en el caso anteri or.
Paso 2:
Definición del esquema físico del
almacenamiento de las dimensio-
nes y sus jerarquías.
El model o en estrel l a que conforma
l a estructura l ógi ca propuesta para
l a bodega de datos, debe ser conver-
ti do en una estr uctur a total mente
desnormal i zada, tal como se presen-
ta en l a Fi gura 11. Este model o fí si co
está confor mado por una tabl a de
hechos, y por l as enti dades en l as cua-
l es se al macenarán l os domi ni os de
l as di mensi ones con sus correspon-
di entes ni vel es jerárqui cos.
Figura 11. Model o l ógi co en estrel l a, y model o fí si co de l a bodega.
Para el proceso de conversi ón de cada
una de l as trayectori as que confor-
man el model o en estrel l a, en enti da-
des desnormal i zadas, se puede uti l i -
zar uno de l os si gui entes esquemas
de conversi ón.
7
1. Conversión vertical
o recursiva
En esta conversi ón, se uti l i za una l l a-
ve pri mari a úni ca, para cada di men-
si ón. El domi ni o de esta l l ave pri ma-
ri a se obti ene medi ante l a uni ón de
todos l os domi ni os de l as enti dades
que conforman l a trayectori a de l a
di mensi ón, es deci r, si l os domi ni os
de l as enti dades que confor man l a
trayectori a son: {enero, febrero, mar-
zo, abr i l ....}; {1er _tr i m, 2º_tr i m,
3er _tr i m, 4º_tr i m}; {1er _s em,
2º_sem}, el domi ni o de l a l l ave pri ma-
ri a será: {enero, febrero, marzo, abri l ,
...., 1er _tr i m, 2º_tr i m, 3er _tr i m,
4º_tri m; 1er_sem,2º_sem}. En l a Fi -
gura 12 se presenta, de manera grá-
fi ca, este esquema de conversi ón.
7. Mcguff, F. Designing the perfect Data Warehouse. 1998.
30
SISTEMAS
& TELEMÁTICA
Figura 12. Conversi ón verti cal de l a trayectori a de una di mensi ón.
Adi ci onal mente, en este esquema de
conversi ón a cada val or del domi ni o
se l e asoci a un val or padre, el cual
tambi én pertenece al domi ni o; de esta
manera se i mpl ementa l a jerarquí a
defi ni da en l a trayectori a, represen-
tada en l a di mensi ón, dentro del mo-
del o en estrel l a.
Este esquema para el manejo de l as
jerarquí as (i d_di mensi ón, i d_padre)
permi te i mpl ementar fáci l mente l a
oper aci ón de des en r ol l e («dr i l l -
down»), cuando se real i zan consul tas
a l a bodega de datos. Si n embargo,
esta estr uctur a es efi ci ente, si l as
agregaci ones para cada ni vel jerár-
qui co son precal cul adas y al macena-
das en l a bodega.
Este esquema de conversi ón es el más
r ecomendado par a i mpl ementar l a
estructura fí si ca de una bodega, cuan-
do l as di mensi ones están compuestas
por jerarquí as desbal anceadas.
2. Conversión horizontal
En esta conversi ón, l a l l ave pri mari a
de l a di mensi ón se confor ma como
una l l ave compuesta por l as l l aves de
cada una de l as enti dades que con-
for man l a tr ayector i a de l a di men-
si ón. En l a Fi gura 13 se presenta, de
manera gráfi ca, este esquema de con-
versi ón.
Figura 13: Conversi ón hori zontal de l a trayectori a de una di mensi ón.
31
SISTEMAS
& TELEMÁTICA
Este esquema de conversi ón es el más
recomendabl e, si l as agregaci ones de
datos se real i zan de manera di námi ca.
Paso 3:
Definición de los atributos que
conforman las tablas de hechos
y las dimensiones del modelo.
En este paso fi nal , se i denti fi can para
cada tabl a de hechos y cada di men-
si ón l as caracterí sti cas de l os atri bu-
tos que conforman cada estructura.
Una vez asi gnados todos l os atri bu-
tos, se real i za un anál i si s cruzado en-
tr e l a tabl a de hechos y l as di men-
si ones, par a establ ecer l os ti pos de
cál cul o matemáti co que pueden ser
real i zados, sobre l a tabl a de hechos.
La especi fi caci ón de l os atri butos que
conforman l a tabl a de hechos se debe
real i zar si gui endo el formato que apa-
rece en el Cuadro 3.
Cuadro 3: Formato para l a defi ni ci ón de l os atri butos
de una tabl a de hechos.
I gual mente, para l a especi fi caci ón de l os atri butos que conforman l as di men-
si ones se debe uti l i zar el formato que aparece en el Cuadro 4.
Cuadro 4: Formato para l a defi ni ci ón
de l os atri butos de una di mensi ón.
32
SISTEMAS
& TELEMÁTICA
Fi nal mente, se deben establ ecer l os
ti pos de cál cul os matemáti cos como
suma, conteo, pr omedi o, mí ni mo,
máxi mo, que pueden ser apl i cados a
l os val ores al macenados en l as tabl as
de hechos. El resul tado de esta revi -
si ón debe quedar consi gnado en una
matri z de cruce, como l a presentada
en el Cuadro 5.
A manera de ejempl o, se presenta en l os si gui entes cuadros l a defi ni ci ón de
atri butos para l a tabl a de hechos y para l as di mensi ones defi ni das en el ejem-
pl o anteri or, y esquemati zadas en l a Fi gura 7.
Tabl a de hechos
Atri buto 1
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Di mensi ón a
2. Di mensi ón b
3. Di mensi ón c
.....
Atri buto 2
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Di mensi ón a
2. Di mensi ón b
3. Di mensi ón c
Atri buto 3
Dimensiones Suma Conteo Prom. Mín. Máx.
1. Di mensi ón a
2. Di mensi ón b
3. Di mensi ón c
....
Cuadro 5: Operaci ones matemáti cas
para cada atri buto de l a tabl a de hechos.
33
SISTEMAS
& TELEMÁTICA
Cuadro 6: Defi ni ci ón de l os atri butos de l a tabl a de hechos sobre ventas.
Nombre de l a estructura de l a bodega Área de ventas
Tabl a de hechos Ventas
Atributos tipo Pk Descripción
I d l ugar C(35) Sí I denti f. de l a di mensi ón l ugar
I d ti empo C(12) Sí I denti f. de l a di mensi ón ti empo
i d producto C(30) Sí I denti f. de l a di mensi ón producto
Uni dades vendi das N(8,0) Valor 1 de la tabla de hechos
Pesos-venta N(10,2) Valor 2 de la tabla de hechos
Cuadro 7: Defi ni ci ón de l os atri butos de l as di mensi ones,
para l a estructura de ventas.
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
Nombre de la estructura de la bodega
34
SISTEMAS
& TELEMÁTICA
Cuadro 8: Operaci ones matemáti cas para cada atri buto
de l a tabl a de hechos sobre ventas.
Tabl a de hechos Ventas
Atri buto 1 Uni dades vendi das
Dimensiones Suma Conteo Prom Mín Máx
Lugar
Ti empo
Producto
Atri buto 2 Pesos-venta
Dimensiones Suma Conteo Prom Mín Máx
Lugar
Ti empo
Producto
CONCLUSIÓN
Medi ante l a apl i caci ón del enfoque de
Si stemas para l a defi ni ci ón de l os i n-
di cadores cl aves de gesti ón de l a or-
gani zaci ón, se ha l ogr ado ar ti cul ar
una propuesta para model ar, de ma-
nera ordenada y si stémi ca, l as estruc-
turas de l as bodegas de datos que ser-
vi rán de soporte a l a i mpl ementaci ón
de si stemas de i nformaci ón gerenci al ,
hechos a l a medi da de l as necesi da-
des de i nfor maci ón de l a ger enci a.
Esta propuesta faci l i ta, ordena y si s-
temati za un proceso que en al gunas
organi zaci ones se real i za de manera
i ntui ti va y, en otras medi ante l a uti -
l i zaci ón de estr uctur as de bodegas
que han si do defi ni das para otras or-
gani zaci ones. El model o propuesto,
que se aparta de muchos de l os enfo-
ques presentados por l os i nvesti gado-
res en este campo, se convi erte en una
opci ón vál i da para el di seño de si ste-
mas de i nformaci ón gerenci al , en par-
ti cul ar para el di seño de bodegas de
datos depar tamental i zadas («Data
Marts»).
35
SISTEMAS
& TELEMÁTICA
BIBLIOGRAFÍA
• Mcguff, F. Designing the perfect
Data War ehouse. 1998. http://
members.aol .com/fmcguff/dwmo-
del /i ndex.htm
• Ki mbal l R. The Data Warehouse
Toolkit. John Wi l ey & Sons, 1996.
• I nmon W.H. Building The Data
Warehouse. QED Pr ess /Jhon
Wi l ey, 1992.
• Gol farel l i , M; Mai o, D; Ri zzi , S.
Conceptual Design of Data Ware-
house From E/ R schemes. http//
www.csr.uni b.i t/~gol fare/db.html ,
1998.
• Bahamón, J. H. Construcción de
indicadores de gestión bajo el en-
foque de sistemas. S&T Revi sta de
l a Facul tad de I ngeni erí a, Uni ver-
si dad I cesi . 2003.
• Chuck, B; Di ck, H; Don, S; Rhon-
da; Eunsaeng, K.; Ann, V. Data
Model i ng Techni ques for Data
Warehouse. I BM. 1998.
• Todman, C. Desi gni ng a Data
Warehouse: Supporting Customer
Relationship. Prenti ce Hal l . 2001
CURRÍCULO
J osé Hernando Bahamón L. I nge-
ni ero El ectróni co de l a Uni versi dad
del Cauca, especi al i sta en Admi ni s-
traci ón de l a Uni versi dad I cesi y ma-
gí ster en Di recci ón Uni versi tari a de
l a Uni versi dad de l os Andes. Profe-
sor i nvesti gador de l a Uni ver si dad
I cesi . Vi ncul ado a l a Uni versi dad I ce-
si desde 1988. Ha si do jefe del Depar-
tamento Académi co de Si stemas
(1988-1998), Di rector del programa
de I ngeni er í a de Si stemas (1998-
2000), y en l a actual i dad es el Di rec-
tor Académi co de l a Uni versi dad.
36
SISTEMAS
& TELEMÁTICA