You are on page 1of 11

PLAN LECTOR

ASIGNATURA: Algebra lineal

INTEGRANTES: Mauricio Jos Ferrer Castro

Neuris Rojas Rodrguez

Sergio Padilla Camacho

Mario Herazo Hernndez

Jos Blanco Altamiranda

DOCENTE: Claudio Aldana

SECCION: 4

FECHA: 26/05/2017

FUNDACIN UNIVERSITARIA TECNOLGICO COMFENALCO


EL SECRETO DE GOOGLE Y EL ALGEBRA LINEAL

INTRODUCCION

La internet se ha convertido en una herramienta fundamental para los matemticos


y algebraicos que existen en el mundo ya que esta tecnologa ofrece herramientas
algortmicas que permiten de una u otra manera facilitar clculos desde los ms
fciles a los ms complejos resolviendo en minutos lo que el humano resolvera en
horas y horas de estudios Desde hace unos aos, Google se ha convertido en el
buscador estndar en la red. Uno de sus secretos, quizs la clave de su xito, es
el algoritmo PAGERANK que utiliza para ordenar los resultados de las bsquedas.
El objeto de este informe es describir el modelo y los resultados matemticos que
estn en la base de estos algoritmos.

Es indudable que El lgebra lineal en general y el problema del clculo de vectores


y valores Propios que necesitamos conocer para decidir si una matriz es
diagonalizable En particular son muy importantes en la informtica, ya que estn
presentes en Varios procesos centrales en esta disciplina.

El nombre de google proviene de una variacin sobre el trmino googol, 10 100.


Tenemos los resultados de una bsqueda: cmo los mostramos, en qu orden?
Necesitamos un criterio de ordenacin, una asignacin de importancias a cada sitio
de la red:
Sitios P1,..., Pn
Importancias x1,..., xn

Google utiliza el llamado sistema PageRank.

En 1998 se propusieron los dos primeros algoritmos de anlisis de enlaces y


bsqueda en la web:
HITS: Presentado por Jon Klineberg en Enero de 1998 en el Ninth Annual
ACMSIAM Symposium on Discrete Algorithms
PageRank: Presentado por Sergey Brin y Larry Page en Abril de 1998 en la
Seventh International World Wide Web Conference (WWW7).

OBJETIVO
Mostrar algunos de los ingredientes matemticos que estn en la base del
funcionamiento del algoritmo (PageRank)

JUSTIFICACION

Consiste en describir los elementos relevantes para la cuestin que interesa, la


asignacin de importancias. A las pginas asignamos etiquetas P1, P2,. . ., Pn.
La red puede ser descrita mediante un grafo (dirigido) G. Cada pgina Pj de la red
es un vrtice del grafo, y hay una arista (dirigida) entre los vrtices Pi y Pj si desde
la pgina Pi hay un enlace a la pgina Pj.
La frmula que utiliza google para ordenar los resultados de nuestra bsqueda se
basa en la Page Rank de cada pgina la cual la podemos averiguar mediante un
algoritmo que es capaz de gestionar ms de 25.000.000.000 pginas (numero el
cual sube cada da rpidamente), con enlaces las unas con las otras.
Imaginemos que un surfista se dedica a navegar por la red. En un cierto instante de
tiempo est en una pgina, por ejemplo, en P1. En el instante siguiente, algo
aburrido de los contenidos de P1, va a saltar a una de las pginas a las que enlaza
P1 (digamos que hay N1 de ellas). Pero, exactamente a cul? Pues como su
nombre lo indica, nuestro surfista es un surfista aleatorio. As que, para decidir a
cul de ellas va, sigue una distribucin de probabilidad uniforme.
DESARROLLO

El buscador Google
El origen del buscador Google es ya bien conocido. Fue diseado en 1998 por
Sergei Brin y Lawrence Page, dos estudiantes de doctorado en Informtica de la
Universidad de Stanford: Brin se haba graduado en Maten ticas, y Page en
Informtica. Los vemos en las fotografas de la derecha3. Dos jvenes que hoy, en
la frontera de la treintena, se han convertido en multimillonarios.

El modelo

Los vrtices son puntos del plano, mientras que las aristas son flechas que unen
esos puntos. Pero, a los efectos que aqu perseguimos, conviene considerar una
interpretacin alternativa, matricial. Vamos, pues, a formar una matriz M, de
dimensiones nn, cuyas filas y columnas van etiquetados con los smbolos P1,. . .
, Pn, y cuyas entradas son ceros y unos. La entrada mij de la matriz ser un uno si
es que hay un enlace de la pgina Pj a la pgina Pi; y un cero en caso contrario:

La matriz M es la matriz de adyacente del grafo. No tiene por qu ser simtrica,


pues nuestro grafo es dirigido.
El postulado Pagerank implica:
Mx = x
es la constante de proporcionalidad un valor propio de M
x = (x1, x2,. . ., xN) es el vector de importancias de las pginas censadas un
vector propio de M (asociado a ).

Ya hemos escrito la constante de proporcionalidad con el smbolo . Y es que, como


cualquier estudiante de un curso de Algebra lineal reconoce al instante, la cuestin
se ha transformado en un problema de auto valores y auto vectores: nuestro
anhelado vector de importancias x no es sino un autovector de la matriz M que,
recordemos, recoga la informacin sobre la estructura de la red (vrtices y
relaciones de adyacencia). S, de acuerdo, un autovector, pero cul? Hay tantos. .
. Y adems, cmo podemos calcularlo?, la matriz es inimaginablemente grande:
recordemos, varios miles de millones de filas (o columnas).

Matrices irreducibles
Hay varias maneras de entenderlo.
1. No existe ninguna permutacin (de filas y columnas) que transforma A en una
matriz del tipo

Donde A11 y A22 son matrices cuadradas.


2. La matriz (I+A) n1, donde I es la identidad nn, tiene todas sus entradas
positivas.
3. Si A es la matriz de adyacencia de un grafo, entonces el grafo est fuertemente
conectado.
Observemos primero que el teorema de Frobenius generaliza realmente el de
Perron, pues si A > 0, entonces es A 0 e irreducible.
Segundo, si la matriz A es irreducible, entonces la cuestin queda completamente
resuelta: existe un nico autovector con entradas no negativas, que adems est
asociado al auto valor positivo de mdulo mximo. Estos teoremas, conjuntamente,
se conoce como teora de Perron-Frobenius

El surfista aleatorio

Este modelo no es determinista, sino probabilstico: no sabemos dnde estar un


instante de tiempo despus, pero s con qu probabilidad estar en cada uno de
los posibles destinos. Y adems es un modelo dinmico, porque el mismo
argumento se podra aplicar al segundo movimiento, y al tercero, etc. Nuestro
surfista sigue lo que se denomina un paseo aleatorio por el grafo. En el dibujo de
la derecha mostramos una posible situacin: de P1 parten tres aristas, a los
vrtices P2, P6 y P8. As que el navegante sortea entre estas tres pginas, con
probabilidad 1/3 para cada una de ellas. Si, por ejemplo, el resultado del sorteo
hubiera sido la pgina P2, entonces volvera a sortear, pero esta vez asignando
probabilidad 1/4 a cada una de los cuatro posibles destinos desde P2. La
formulacin es muy sugerente, pero no est claro cmo podemos formalizarla:
cmo podemos calcular, por ejemplo, la probabilidad de que, partiendo de la
pgina P1, el navegante est en la pgina P17 tras cinco instantes de tiempo. Ms
aun, todava ni sospechamos qu puede tener que ver con nuestro problema de
asignacin de importancias.

La clasificacin para las eliminatorias por el ttulo

Con tanta reinterpretacin y reformulacin, nos estamos olvidando de la cuestin


que nos interesa: el sistema de ordenacin de Google. Disciplinmonos y
volvamos a ella. Conviene precisar que las ideas que utiliza Google para ordenar
los resultados provienen de unos algoritmos desarrollados por Kendall y Wei en
los aos 50 (uups, del siglo pasado!, que siempre nos olvidamos de recalcarlo),
vanse [Ke] y [We].
Para clculos serios: el ordenador

Tenemos seis equipos, E1,..., E6: los tres primeros forman una conferencia, los
siguientes la otra. Cada equipo juega 21 partidos en total: 6 contra los de su propia
conferencia, 3 contra los de la otra. La informacin sobre las victorias conseguidas
est contenida en la siguiente tabla:

Las Matemticas entran en escena

Es la hora de las Maten ticas, esa Ciencia que se ocupa de realidades


abstractas, virtuales, para, a travs de ellas, entender realidades concretas.
Pongmonos, pues, maten ticos, y destilemos la esencia comn a todas las
cuestiones de las que nos hemos ocupado hasta ahora.

Y la cuestin computacional?

Podemos, por supuesto, calcular todos los auto vectores y quedarnos con el que
nos interesa. Pero incluso aunque utilizramos mtodos eficaces para calcular
auto valores (no mediante determinantes, desde luego), la tarea seria excesiva.
Pero de nuevo la propia estructura del problema sale en nuestra ayuda para
facilitarnos el clculo. Una feliz coincidencia. Todo arranca de la observacin,
hasta ahora inocente, de que el autovector que buscamos est asociado al auto
valor de mdulo mximo.
Estamos realmente en una situacin ideal?

Es una estructura peculiar, que nos recuerda a un organismo biolgico, una suerte
de gigantesca ameba. La pieza central (SCC, strongly connected component) es,
como el nombre indica, una componente fuertemente conexa. Junto a ella
aparecen otras dos piezas12: la IN est formada por las pginas que tienen
enlaces hacia las de SCC, y la OUT esta constituida por las pginas a las que
apuntan los de SCC. Adems aparece una especie de dendritas, que contienen
pginas desde las que no se puede llegar a los nodos de SCC, ni tampoco son
accesibles desde ellos (que, en ocasiones, y para aumentar la complejidad,
pueden llegar a formar tubos).
Matrices no negativas en otros contextos

Las matrices no negativas, y la teora de Perron-Frobenius asociada, tienen


aplicaciones en muchos otros campos, adems del problema de ordenacin que
nos ha ocupado hasta aqu. Para situarlas en la posicin que merecen, vamos a
revisar brevemente algunos modelos en los que resultan imprescindibles (el lector
podr encontrar otras aplicaciones en [Ma]). Esta ubicuidad se explica por las
siguientes dos observaciones: En las situaciones reales, las interacciones que se
miden son, muy frecuentemente, positivas, o al menos no negativas. Y los objetos
con que codificamos estas medidas son matrices cuyas entradas son no
negativas. Por otro lado, muchos modelos son procesos iterativos simples: de un
estado inicial x0 pasamos a uno general dado por xk = Akx0. La convergencia del
mtodo depende del tamao del auto valores de A, o ms bien de la razn entre
los tamaos del auto valores (en particular, del ms grande a los dems). Y aqu,
por supuesto, el teorema de Perron-Frobenius tiene mucho que decir, si es que la
matriz es no negativa.

Modelos econmicos

Una economa (muy simplificada) consta de tres sectores, digamos agricultura,


industria y servicios, cuyas producciones respectivas son x1, x2 y x3 (en las
unidades que sean). La hiptesis fundamental es que el consumo que de la
produccin xi hace el sector j es proporcional a xj (la produccin de j). Este es un
modelo bien conocido en Economa el modelo input-output de Leontief 17.
Podramos estar, por ejemplo, en una situacin como la que se describe en la
siguiente tabla:
De las x1 unidades producidas por el sector agrario, el 30 % son auto
consumidas, 0.2 x2 utilizadas por la industria, 0.3 x3 por el sector de servicios,
mientras que 4 unidades lo son por los consumidores finales. Ahora, la cuestin,
escrita en trminos matriciales, adopta la forma Ax + b = x. Y la pregunta es: dado
un vector de consumo b 0, tiene el sistema anterior una solucin x 0? Desde
luego, ser el caso si la matriz I A tiene una inversa no negativa, pues entonces
x = (I A) 1 b 0. Una condicin suficiente para garantizar la existencia de esta
inversa no negativa es que el auto valor dominante de A sea 18 < 1.

CONCLUSIN

Concluyendo este informe podemos ver y aprender, como una idea simple e
ingeniosa ha dado lugar a nivel mundial, ya que por medio de su eficacia y eficiencia
ha podido facilitar el trabajo y el conocimiento a muchos matemticos y algebraico,
para ellos tambin aquellos en etapa de aprendizajes, por medio de estos motores
de bsquedas que nos ofrece google se ha logrado progreso al nacimiento de un
verdadero imperio comercial.
esta tecnologa se implement con una hazaa computacional, la idea inicial solo
requiri matemticas elementales lgebra lineal y teora de probabilidades entre
otras, Las herramientas utilizadas, especialmente la diagonalizacin de matrices,
son estndar en matemticas, pero han demostrado su verdadera potencia cuando
se han usado fuera de su contexto habitual, como las grandes empresas y
multinacionales que utilizan estas herramienta para reducir tiempos, costos
aumentar ganancias y pronosticar por medio de probabilidades inventarios en
periodos cortos o a largo plazo con el fin de mantener estndares estadsticos
satisfactorios, esta herramienta computacional revoluciono de una manera
excelente y gracias a estos motores de bsquedas se han hecho millones de
soluciones.
REFERENCIA BIBLIOGRAFICAS

http://el-algebra-lineal.blogspot.com.co/2015/12/google-y-el-
algebra-lineal.html

https://www.uam.es/personal_pdi/ciencias/gallardo/google_sema.
pdf

https://es.slideshare.net/LexeRoX/algebra-lineal-y-los-
navegadores-de-internet

HTTP://www.sema.org.es/documentos/fernandez_google.pdf