You are on page 1of 15

TRANSFORMACIONES LINEALES PARA REDES NEURALES ARTIFICIALES Objetivo: Determinar características fundamentales de algunas transformaciones lineales generales.

La multiplicación de un vector de entrada por una matriz de pesos es un ejemplo de una transformación lineal.

Transformación lineal
Una transformación consiste de tres partes: 1.- Un conjunto de elementos X={Xi} llamado dominio. 2.- Un conjunto de elementos Y={Yi} llamado rango. 3.- Una regla que relaciona cada Xi  X a un elemento Yi  Y.

Una transformación A es lineal si: 1.- Para todo X1 ,X2  X , A(X1 + X2) = A(X1) + A(X2) 2.- Para todo X  X, a  R, A(aX) = aA(X).

se puede rotar primero cada vector y después sumarlos. Por lo tanto la rotación es una transformación lineal. La tercera figura ilustra la propiedad 2: si se quiere rotar un vector escalado. La segunda figura muestra que se satisface la primera propiedad: si se quiere rotar la suma de dos vectores.Ejemplo: Transformación obtenida al rotar vectores en R2 por un ángulo . A(X1+X2) X1+X2 A(X1) X2 X1 A(X2)  A(X) X A(aX)=aA(X) aX X A(X) La transformación de rotación se muestra en la primera figura. . se puede rotar primero el vector y luego escalarlo.

L. y sea {u1. entonces podemos escribir n m . con dominio X y rango Y (A:X  Y) Entonces A(x) = y se puede escribir como A(  x jv j ) =  yiui j 1 i 1 Como A es un operador lineal. vn} una base del espacio vectorial X. .. u2. . . um} una base para el espacio vectorial Y.. Entonces para dos vectores cualquiera x  X e y  Y x =  x iv i i 1 n e y=  yiui i 1 m Sea A una T.. . se puede representar por una matriz (cualquier vector general de un espacio vectorial finito dimensional puede representarse por una columna de números). Sea {v1. v2..Representación matricial Cualquier transformación lineal entre dos espacios vectoriales finito dimensionales.

por lo tanto los coeficientes que multiplican a ui son cero: n  aijxj = yi j 1 Esto lleva a la multiplicación matricial siguiente: .yi) = 0 j 1 i 1 i m n Como los ui forman una base. xjA(vj) =  yiui j 1 n m i 1 Como los vectores A(vj) son elementos de Y. son independientes. se pueden escribir como una combinación lineal de los vectores de la base de Y: A(vj) =  aijui i 1 Luego xj  aijui =  yiui j 1 i 1 i 1 n m m m Revirtiendo el orden de la suma  ui  aijxj = yiui i 1 j 1 m n m i 1 reacomodando  u ( aijxj .

........ X=Y=R2 y con las bases estándares u i = v i = si ............. Si se cambia el conjunto base del dominio o del rango.. amn xn ym transformación lineal entre dos espacios vectoriales finito Para cualquier dimensionales hay una representación matricial (no es única...... a2n . a1n y1 a21 a22 .. Se transforma cada vector base del dominio y se expande en términos de los vectores base del rango.. Se busca una representación matricial para esa transformación........ Trabajando con el dominio y el rango iguales....... Ejemplo de representación matricial utilizando la transformación de rotación... como no lo es la representación columna de un vector general. x1 x2 .... = y2 am1 am2 .a11 a12 ..... la representación matricial cambiará).

A(s2) -Sen() cos() cos()   A(s1) Sen() A(s1) = cos() s1 + sen()s2 =  ai1si = a11s1 + a21s2 i 1 A(s2) = .sen()s1 + cos()s2 =  ai2si = a12s1 + a22s2 i 1 2 2 .Usamos A(vj) =  aijui. i 1 m Los coeficientes de cada expansión generan una columna de la matriz.

v2. Sea la T. el vector rota por un ángulo . u2. vn} una base de X y {u1.. .L. um} una base para el espacio vectorial Y. ..La representación matricial será cos() A= sen() -sen() cos() Cuando se multiplica un vector por la matriz. Cambio de Base La representación matricial cambia cuando cambia la base de la transformación. .. . Para dos vectores cualquiera x  X e y  Y x = x iv i i 1 n e y = yiui i 1 m Entonces si A(x) = y. la representación de la transformación será .. Sea {v1. A:X-->Y.

. w2. sea {t1. Cada ti es un elemento de X.. t2.a 11 a 12  a 1 n x 1 a 221 a 22  a 2 n x 2 am 1 am 2  am n xn = y1 y2 ym Ax = y Supongamos que ahora usamos otros conjuntos bases para X y para Y. . .. wm} la nueva base para Y. Esto produce una nueva representación matricial A*xn = yn ¿Cuál es la relación entre A y A*? Para encontrarla hay que encontrar la relación entre los dos conjuntos de bases. tn} la nueva base de X y {w1. se puede expandir en términos de la base original para X: ... Con estas nuevas bases x = xniti i 1 n e y = yniwi i 1 m xn y yn son los vectores de coeficientes en las nuevas expansiones. .

+ Xnntn = BtXn Se define una matriz cuyas columnas son los wi Bw = w1 w2  wm  ti = t2i tni wi = w2 i y = BwYn Ahora sustituyendo x e y en Ax =y obtenemos ABtXn = BwYn .ti =  tv j 1 ji j n y wi =  wjiuj j 1 m por lo tanto los vectores base se pueden escribir como columnas de números t1i w1 i  wmi Se define una matriz cuyas columnas son los ti Bt = t1 t2  tn Podemos escribir en forma matricial x = Xn1t1 + Xn2t2 + ...

Si multiplicamos ambos lados de esta ecuación por (Bw)-1 [(Bw)-1A Bt]xn = yn que al compararla con A*xn = yn da lugar al cambio de base siguiente: A* = [(Bw)-1A Bt] Transformación similar Este resultado. se llama transformación similar. La escogencia correcta de la base permite obtener una representación matricial que revela las características claves de la transformación lineal. Autovalores y autovectores Son dos propiedades de las transformaciones lineales (dan información de estabilidad redes como la Hopfield). Los vectores z  X distintos del cero y esos escalares  que satisfacen A(z) = z se llaman autovectores (z) y autovalores (). Sea A: X --> X una transformación lineal (dominio igual al rango). que describe la relación entre dos representaciones matriciales cualquiera de una transformación lineal dada. .

Un autovector de una transformación representa una dirección. entonces az también lo hace. puesto que no se trata realmente de un vector sino de un espacio vectorial. Cálculo de los autovectores y de los autovalores: Supongamos una base para el espacio vectorial n-dimensional X.El término autovector es un poco incómodo. tal que cualquier vector en esa dirección. . Entonces la representación matricial de A(z) = z se puede escribir como AZ = Z o [A-I]Z = 0 Las columnas de [A-I] son dependientes (los Z son distintos de cero). dado que si z satisface la ecuación anterior. y por lo tanto el determinante de esta matriz será cero: |[A-I]| = 0 Este determinante es un polinomio de orden n. al ser transformado. algunas de las cuales complejas y repetidas. por lo tanto la ecuación anterior siempre tendrá n raíces. Para el caso de la rotación del vector: Habrá cualquier vector que cuando se rote 30 grados continúe apuntando en la misma dirección?. continuará apuntando a la misma dirección pero estará escalado por el autovalor. NO.

j sen() Esta transformación no tiene autovalores reales (si sen() # 0).2 cos() + 1 = 0 las raíces de esta ecuación son: 1 = cos() + j sen() 2 = cos() . . La matriz de la transformación para la base estandar es: cos() A= -sen() sen() cos() por lo que obtenemos el determinante: cos()- -sen() sen() cos() . =0 o 2 .2 cos() + ((cos() )2 + (sen()2) = 2 .Ese es un caso cuando no hay autovalores reales.

éste apuntará en una nueva dirección. por lo tanto es el primer autovector será [1 0] ó cualquier escalar múltiplo. Z21 = 0. .Esto significa que cuando cualquier vector real es transformado. Otro ejemplo: -1 1 -1- 0 1 -2- A= 0 0 –2 =0 2 + 3 + 2 = ( +1)(  + 2) = 0 y los autovalores son 1 = -1 2 = -2 para encontrar los autovectores -1- 1 0 Z = -2- 0 0 0 Resolviendo con 1 = -1 se obtiene Z11 = cualquiera.

con los autovalores en la diagonal. Z21 = 1. Cuando se tiene autovalores distintos se puede diagonalizar la representación matricial usando los autovectores como base. Z22 = -1 es el segundo autovector o cualquier escalar múltiplo. De A* = [(Bw)-1A Bt] 1 1 -1 1 A* = [B-1A B] = 1 1 = -1 0 0 -1 0 -2 0 -1 0 -2 Esta es una matriz diagonal. Busquemos la matriz de la transformación precedente usando los autovectores como una base. Diagonalización matricial Cuando hay n autovalores distintos se puede garantizar encontrar n autovectores independientes.Resolviendo con 2 = -2 Z22 = -Z21 . Por lo tanto los autovectores constituyen una base para el espacio vectorial de la transformación. .

..….. zn] donde { z1 ... . Entonces 1 0.. z2 .0n [B-1AB] = donde { 1 .. Aprendizaje del Rendimiento .El proceso es como sigue: Sea B = [z1 z2 ..…. ..0 0…. ...0 0...0 0 2 0….... . 2 ... zn } son los autovectores de una matriz A. n } son los autovalores de la matriz A...