You are on page 1of 9

Instituto Politcnico

Nacional
Escuela Superior de Computo

Distribuited Data Bases

Alumno:
Chvez Ramos Francisco

Tarea 2

16-Junio-2015

ndice
Marco Terico........................................................................................................ 2
DEFICION......................................................................................................... 2
ALGORITMO...................................................................................................... 2
Conclusin............................................................................................................ 7
Bibliografa............................................................................................................ 7

Marco Terico
DEFICION
Se comienza en el vrtice inicial (vrtice con ndice 1) y se marca como vrtice
activo, a diferencia con la BEP ahora se visitan en orden creciente de ndice todos
los vecinos del vrtice activo antes de pasar al siguiente. Hasta que todos los
vrtices hayan sido visitados, en cada paso se van visitando en orden creciente de
ndice todos los vecinos del vrtice activo. Cuando se han visitado todos los
vecinos del vrtice activo, se toma como nuevo vrtice activo el primer
vrtice X visitado despus del actual vrtice activo en el desarrollo del algoritmo.

ALGORITMO
Sea G = (V, A) un grafo conexo
V = V un conjunto de vrtices
A un vector de arcos inicialmente vaco
P un vector auxiliar inicialmente vaco:
1. Se introduce el vrtice inicial en P y se elimina del conjunto.
2. Mientras V no sea vaco repetir los puntos 3 y 4. En otro caso parar.
3. Se toma el primer elemento de P como vrtice activo.
4. Si el vrtice activo tiene algn vrtice adyacente que se encuentre en V:
Se toma el de menor ndice.
Se inserta en P como ltimo elemento.
Se elimina de V.
Se inserta en A el arco que le une con el vrtice activo.
Si el vrtice activo no tiene adyacentes se elimina de P.

2.- El algoritmo BEA toma como entrada la matriz de afinidad de atributos (AA),
permuta sus renglones y columnas y genera una matriz de afinidad agrupada
(CA). Las permutaciones son realizadas de tal manera que se maximice la
siguiente medida de afinidad global (AM).
1. Se dise especficamente para determinar grupos de elementos
similares frente a una ordenacin lineal de los elementos (es decir,
grupos de atributos con gran afinidad frente a grupos de atributos
con valores pequeos de la misma).
2. Los grupos resultantes no eran sensibles al orden en el cual los
elementos se dispusiesen por el algoritmo.
3. El tiempo de clculo del algoritmo es razonable, O(n 2), donde n es el
nmero de atributos.
4. La interrelacin secundaria entre grupos de atributos es identificable.

El algoritmo de energa lmite toma como entrada la matriz de atributos


afines, permuta filas y columnas y genera una matriz de grupos afines
(MGA). La permutacin se hace de tal manera, que se maximice la
siguiente medida de afinidad global (AG):

AG
i 1

afd ( A , A )CV
i

j 1

donde CV son los cuatro vecinos de un elemento de la matriz, es decir

CV afd ( Ai, Aj 1) afd ( Ai, Aj 1) afd ( Ai 1, Aj ) afd ( Ai 1, Aj )


A su vez,

afd ( A0, Aj ) afd ( Ai, A0) afd ( An 1, Aj ) afd ( Ai 1, An 1) 0

El ltimo conjunto de condiciones toma en consideracin los casos en los


3

que los atributos se sitan en la MGA a la izquierda del atributo extremo


izquierdo o a la derecha del atributo extremo derecho durante la
permutacin de columnas, e igualmente respecto a la fila que se sita en la
parte superior durante la permutacin de filas. En estos casos, tomaremos
el cero como valor de afinidad entre los atributos considerados para su
ubicacin y sus vecinos izquierdos o derechos (superiores o inferiores), que
no existen en la MGA.

La funcin de maximizacin considera slo los vecinos ms prximos,


resultando en el grupo de valores grandes solo estos, y en el grupo de
valores pequeos solo stos. Adems, la matriz de atributos afines es
simtrica, lo cual reduce la funcin objetiva de la formulacin a

El algoritmo se presenta a continuacin. Para la generacin de la matriz de


grupos afines se siguen tres pasos:
1. Iniciacin. Sita y fija una de las columnas de MAA arbitrariamente
dentro de MGA. En el algoritmo se escoge la columna 1.
2. Iteracin. Se toma cada una de las columnas restantes n - i (donde i
es el nmero de columnas que ya se han situado en MGA) y se
intenta situarlas en las n - i posiciones restantes de la matriz MGA.
Se escoge como lugar de emplazamiento aquel que proporciones
una mayor contribucin a la medida de afinidad global descrita
anteriormente. Se contina con este paso hasta que se agote el
nmero de columnas a situar.
Algoritmo BEA Algoritmo BEA

3. Ordenacin de las filas. Una vez que la ordenacin de las columnas


Entrada:
ha finalizado, se debe proceder a ordenar las filas de tal modo que
matrizcoincida
de atributoscon
afinesla de las columnas. Por ejemplo, si
su posicin MAA:
relativa
Salida:
la columna
3 se ha situado en la primera posicin, la fila nmero 3
tambin debera
pasar
a ocupar
MGA: matriz
de grupos
afines la primera posicin.
Inicio
{iniciacin; recuerde que MAA es una matriz de n x n
MGA(*, 1)MAA(*, 1)
MGA(*, 2)MAA(*, 2)
ndice3
mientras ndice n hacer
{escoger la mejor ubicacin para el atributo MAAndice }
inicio
para i=1 hasta ndice-1 por 1 hacer

Para la segunda parte del algoritmo, necesitaramos definir qu significa la


contribucin de un atributo a la medida de afinidad. Esta contribucin puede
derivarse como se expondr ahora. Partiremos de la definicin dada de la
medida de afinidad global que se escribi como
n

AG
i 1

adf ( Ai, Aj )[ afd ( Ai, Aj 1) afd ( Ai, Aj 1)]

j 1

la cual puede rescribirse como


n

AG

i 1

[adf ( Ai, Aj ) afd ( Ai, Aj 1) afd ( Ai, Aj )afd ( Ai, Aj 1)]

i 1

j 1

AG

j 1

i 1

adf ( Ai, Aj )afd ( Ai, Aj 1) afd ( Ai, Aj ) afd ( Ai, Aj 1)

Definamos el lmite lm entre dos atributos Ax y Ay como


n

lim( Ax, Ay ) afd ( Az , Ax)afd ( Az , Ay )


z 1

Entonces podemos escribir AG como

AG [lim( Aj , Aj 1) lim( Aj, Aj 1)]


j 1

Consideremos ahora la siguiente n atributos


A1 A2...
Ai 1Ai AjA
j 1...
An
AG '

AG ''

La medida de afinidad global para estos atributos puede escribirse como


AGant AG AG lim( Ai, Aj ) lim( Ai, Aj )
n

[lim( A , A

) lim( Ai, Ai 1)]

i 1

i 1

[lim( A , A
i

) lim( Ai, Ai 1)]

i 1

i i 2

2 lim( Ai , Aj )

Consideremos ahora que entre los atributos Ai y Aj de la matriz de grupos


afines se sita un nuevo atributo Ak. La nueva medida de afinidad global
sera entonces
AGnueva AG AGlim ( Ai, Ak ) lim ( Ak , Ai )
lim ( Ak , Aj ) lim ( Aj , Ak )
AG AG2lim ( Ai, Ak ) 2lim ( Ak , Aj )
Por tanto, la contribucin a la red de la medida de afinidad global al situar el
atributo Ak entre Ai y Aj es

cont ( Ai, Ak , Aj ) AGnueva AGant


cont ( Ai, Ak , Aj ) 2lim ( Ai, Ak ) 2lim ( Ak , Aj ) 2lim ( Ai, Aj )

Ejemplo . Consideremos la matriz MAA que se desarroll anteriormente


para la relacin CLIENTES. Estudiemos la contribucin que se realiza al
colocar el atributo A4 entre los atributos A1 y A2.

cont(A1, A4, A2) = 2lm(A1, A4) + 2lm(A4, A2) 2lm(A1, A2)


Haciendo los clculos para cada trmino, se obtiene
lm(A1, A4) = 30 + 045 + 045 + 045 + 30 + 00 + 30 + 00 =
0
lm(A4, A2) = 2025
lm(A1, A2) = 0
Por lo tanto, cont(A1, A4, A2) = 20 + 22025 20 = 4050

Conclusin
El algoritmo se concentra en las columnas de la matriz de atributos afines.
Podemos emplear los mismos argumentos y redisearlo de tal manera que
opere sobre las filas tambin. Otro punto importante de este algoritmo es
que mejora la eficiencia, la segunda columna tambin se fija y se sita tras
la primera durante el proceso de iniciacin. Esto es perfectamente vlido,
ya que A2 puede situarse a la derecha o a la izquierda de A1. El lmite entre
las dos, sin embargo, es independiente de las posiciones relativas que
tengan la una sobre la otra. Finalmente, deberamos indicar el problema de
calcular cont en los extremos. Si un atributo Ai se debe situar a la izquierda
del atributo ms a la izquierda, una de las ecuaciones del lmite se calcular
sobre un elemento inexistente, el de la izquierda, y sobre Ak. Entonces,
necesitamos referirnos a las condiciones impuestas en la definicin de la
medida de afinidad global, donde MGA(0, k) = 0. El caso contrario se
produce cuando Aj es el atributo situado ms a la derecha, ubicado ya en la
matriz MGA, y queremos saber cul es la contribucin de situar el atributo
Ak a la derecha de Aj. Ante tal situacin se debe calcular el lm(k, k+1). Ya
que no existe un atributo situado todava en la columna k+1 de la MGA, la
medida de afinidad no puede establecerse. Por tanto, de acuerdo a las
condiciones de los extremos, el valor del lmite es tambin 0.

Bibliografa
1.- CISNEROS Jose, Tipos de fragmentacin de Base de Datos Distribuidas,
repositorio.utn.edu.ec/bitstream/123456789/582/5/ANEXO%20B.doc, 2008.
2.- GUZMAN Daniel, Bases de Datos Distribuidas con una solucin LAMP,
http://repository.uaeh.edu.mx/bitstream/bitstream/handle/123456789/10719/Bases
%20de%20datos%20solucion%20LAMP.pdf?sequence=1, Universidad Autonoma
del Estado de Hidalgo, 2006