Supliment la Cursul 10 Determinarea important ¸ei unui nod ˆ ıntr-o ret ¸ea

ˆ In studiul unor probleme de ret ¸ele sociale/business, ierarhizarea paginilor WEB de c˘ atre motorul Google, ret ¸ele de calculatoare sau de comunicat ¸ie digital˘ a, etc sunt implicate valorile proprii ¸ si vectorii proprii ale/ai matricii de adiacent ¸a ˘ a grafului ce define¸ ste ret ¸eaua sau a unei matrici dedus˘ a din aceasta. O valoare proprie particular˘ a a matricii de adiacent ¸˘ a¸ si un vector propriu corespunz˘ ator codific˘ a nivelul de important ¸a ˘ a nodurilor din ret ¸ea. O ret ¸ea se modeleaz˘ a printr-un graf neorientat sau orientat. Un graf neorientat, G, este definit de o pereche G = (V, E ), unde V = {1, 2, . . . , n} este mult ¸imea nodurilor, iar E mult ¸imea arcelor (conexiunilor dintre noduri). Not˘ am un arc ˆ ıntre nodul i ¸ si j prin (i, j ) ¸ si ˆ ıntelegem arcul ce uneste/conecteaz˘ a nodul i cu j (nu are important ¸˘ a ordinea). • Matricea de adiacent ¸a ˘/conectivitate a grafului G este matricea A = (aij ), i, j = 1, n, unde: { 1 dac˘ a (i, j ) ∈ E aij = 0 dac˘ a i = j sau (i, j ) ∈ /E Matricea de adiacent ¸a ˘ a unui graf neorientat este simetric˘ a, adic˘ a dac˘ a (i, j ) ∈ E atunci ¸ si (j, i) ∈ E . • Un graf orientat are arcele orientate, adic˘ a perechea de noduri (i, j ) ilustreaz˘ a arc orientat de la i la j . Dac˘ a (i, j ) ∈ E , nu este obligatoriu ca ¸ si (j, i) ∈ E . ˆ In plus ˆ ıntr-un graf orientat pot exista ¸ si arce (i, i), de la un nod la el ˆ ınsu¸ si. • Deoarece matricea de adiacent ¸a ˘ a unui graf orientat/neorientat are ca elemente doar pe 0 ¸ si 1, se nume¸ ste matrice nenegativ˘ a (nu are elemente negative). • Un graf neorientat/orientat este conex, dac˘ a oricare ar fi i ¸ si j , dou˘ a noduri distincte, exist˘ a o succesiune de arce ˆ ın E care s˘ a le uneasc˘ a: (i, i1 ), (i1 , i2 ), . . . (ik−1 , ik ), (ik , j ) • Puterea m a matricii de adiacent ¸˘ a, Am = (cij ), codific˘ a urm˘ atoarea informat ¸ie: m elementul cij , din linia i, coloana j a matricii A este egal cu num˘ arul drumurilor de m arce ce leag˘ a nodurile i ¸ si j . • O matrice binar˘ a, A, (de elemente 0 ¸ si 1) este matricea de adiacent ¸˘ a a unui graf orientat/neorientat ¸ si conex dac˘ a¸ si numai dac˘ a exist˘ a un m astfel ˆ ıncˆ at Am are toate elementele nenule (adic˘ a exist˘ a un m astfel ˆ ıncˆ at num˘ arul drumurilor de lungime m ce leag˘ a orice dou˘ a noduri din graf este diferit de zero). O astfel de matrice, A, se nume¸ ste matrice ireductibil˘ a. 1

. Ne ˆ ıntreb˘ am dac˘ a cunoscˆ and doar matricea de conectivitate a unei ret ¸ele putem deduce indicatorii de important˘ a/popularitate a nodurilor sale.2 Supliment Cursul 10. Se ia drept valoare proprie din relat ¸ia (10. ∃ m > m 0. corespunz˘ ator valorii proprii λ1 de coordonate strict pozitive. adic˘ a r˘ ad˘ acina real˘ a ce exist˘ a sigur. . deci o parte din r˘ ad˘ acini pot fi reale ¸ si restul complex conjugate) astfel ˆ ıncˆ at: |λ1 | ≥ |λ2 | ≥ · · · ≥ |λn | are sigur valoarea λ1 real˘ a¸ si simpl˘ a (ordin de multipliciate egal cu 1) ¸ si un vector proT priu v = (x1 . . Matricea de adiacent ¸a ˘. . indicatorii de important ¸a ˘ a nodurilor ret ¸elei. a unui nod i ˆ ıntr-o ret ¸ea. Deci xi = 1 (xj + xj2 + · · · + xjk ) λ 1 unde j1 . . 2. x2 . n (10. j ). j2 . E. .2) ¸ si notˆ and cu x vectorul din Rn ce are drept coordonate. xn )T .e.2) este echivalent˘ a cu λx = Ax. atunci relat ¸ia (10. R˘ aspunsul este afirmativ. i = 1. A. astfel ˆ ıncˆ at A (i. n (10. λ j =1 n i = 1. deoarece relat ¸ia (10. Algebr˘ a liniar˘ a. ∀ i.2) valoarea λ1 . Problema care se ridic˘ a imediat ¸ stiind c˘ a o matrice poate s˘ a nu aib˘ a nici o valoare proprie sau s˘ a aib˘ a mai multe valori proprii este. Petri¸ sor.1) se mai poate scrie: n ∑ j =1 aij xj = λxi . doar termenii cu aij = 1. adic˘ a λ este valoare proprie a matricii de adiacent ¸˘ a. adic˘ a x = (x1 . autoritate) xi . care valoare proprie o folosim ˆ ın definit ¸ia indicatorului de important ¸˘ a a nodurilor. . . . Fie A ∈ Rn×n o matrice nenegativ˘ a¸ si ireductibil˘ a (i. . ˆ In studiul ret ¸elelor se define¸ ste indicatorul de important ¸a ˘ (popularitate. reprezentat˘ a de un graf neorientat ¸ si conex ca fiind num˘ arul: 1∑ xi = aij xj . 1. j ) ̸= 0. jk sunt nodurile cu care nodul i este conectat. .1) Intuitiv aceast˘ a relat ¸ie ilustreaz˘ a c˘ a important ¸a unui nod i este proport ¸ional˘ a cu media indicatorilor de important ¸a/popularitate a nodurilor cu care nodul i este conectat (”spunemi ce prieteni ai ca sa-ti spun cine e¸ sti”). fiind nenegativ˘ a ¸ si ireductibil˘ a (fiind matricea unui graf conex) se aplic˘ a Teorema lui Perron. . n. xn ) . . . . ce are cele n r˘ ad˘ acini ale polinomului caracteristic (atent ¸ie am spus r˘ ad˘ acini. nu valori proprii. a polinomului caracteristic al lui A ¸ si care . corespunz˘ atoare vectorului propriu al indicatorilor de important ¸a ˘. . ˆ In suma de mai sus contribuie efectiv la constuirea prestigiului nodului i. noiembrie 2011 Particularit˘ a¸ tile valorilor ¸ si vectorilor proprii ale unei matrici de adiacent ¸˘ a ireductibil˘ a sunt date de o teorem˘ a celebra ˆ ın algebr˘ a: Teorema Perron.

0). deci indicatorul de important ¸a ˘ se poate raporta ¸ si ca procent.68133064. xn )T x i i=1 care este de asemenea un vector propriu corespunz˘ ator valorii proprii λ1 . 0. .51003631. iar arcele sunt linkurile dintr-o pagin˘ a c˘ atre alte pagini.35792637.32340428. Exemplul 1. −1 − 1 Deci λ1 = 3. 0. noiembrie 2011 3 are cea mai mare valoare absolut˘ a dintre toate r˘ ad˘ acinile.30693606.Supliment Cursul 10. 4. Algebr˘ a liniar˘ a. 1. ci printr-un segment de arc ˆ ın bold 1 1 Am folosit pachetul networkx din Python pentru generarea grafului ¸ si aceasta este modalitatea de ilustrare a orient˘ arii ˆ ın networkx. nodul i are o popularitate de 28%. de coordonate strict pozitive este: v = (0.32340428.51003631. Larry Page ¸ si Serghei Brin. 0.43904224. 1]. x2 . Adic˘ a dac˘ a xi = 0. . Sensul linkului nu e ilustrat prin s˘ ageat˘ a. −1.10. . ce are toate coordonatele strict pozitive. Consider˘ am o ret ¸ea social˘ a format˘ a din 5 persoane. iar ca vector x un vector propriu corespunz˘ ator lui λ1 .43904224) Suma coordonatelor lui v este 2.10. graful WEB orientat din Fig. 0. E.23129921. 0.1: Matricea de conectivitate/adiacent ¸˘ a a ret ¸elei este:   0 0 1 1 0  0 0 1 1 1     1 1 0 1 1 A=    1 1 1 0 1  0 1 1 1 0 Valorile proprii ale matricii A.28.19910372. 3. 2. considerat ca graful WEB: nodurile sunt paginile WEB.2050931639 ¸ si deci vectorul indicatorilor de important ¸a ˘ a nodurilor ret ¸elei este: x = v/2. 0. 0. 0. se define¸ ste vectorul ∑n (x1 . . De exemplu ˆ ıntre pagina 0 ¸ si pagina 2 exista linkuri reciproce. atunci printre toate nodurile ret ¸elei. fondatorii Google au extins calculul populariatii nodurilor la un graf orientat ¸ si conex.23129921. . Petri¸ sor. 0. + xn este 1.19910372)T Observ˘ am c˘ a cea mai mare populariate o au nodurile 2 ¸ si 3 (la egalitate) ¸ si anume 0. indicˆ and orientarea arcelor ¸ si ad˘ augˆ and ˆ ıntre cˆ ateva perechi de noduri ¸ si linkuri reciproce.2050931639 = (0. iar un vector propriu corespunz˘ ator lui λ1 .23129921. 2) ¸ si (2. Asociem celor 5 noduri din reteaua de mai sus. calculate numeric ˆ ın Python sunt: 3.13919415. ¸ si ilustrat˘ aˆ ın graful neorientat din Fig. Pentru a m˘ asura popu1 laritatea prin indicatori din intervalul [0. Astfel indicele de xi ¸ si suma tutor indicatorilor de important ¸a ˘ important ¸a ˘ a nodului i este x1 + x2 + . . codificate 0.2: Graful ce reprezint˘ a aceast˘ a ret ¸ea a fost obt ¸inut din graful neorientat de mai sus. adic˘ a arce le (0. .

0.48053382. Algebr˘ a liniar˘ a. numit˘ a  0 0  0 0  A=  1 0  0 1 0 1 matricea hyperlink este:  1 1 0 1 1 1   0 1 1   0 0 0  0 1 0 R˘ ad˘ acinile polinomului s˘ au caracteristic ordonate.62481053i.27927686.78077641−0. ˆ ın ordinea descresc˘ atoare a valorii absolute (modulului) sunt: 2.38248988.4 Supliment Cursul 10.51669186. iar dou˘ a sunt complex conjugate. Matricea de adiacent ¸˘ a a grafului.78077641+0. 0.081019. −1. 0. −0. noiembrie 2011 1 2 4 3 0 Fig. Petri¸ sor.1: Graf neorientat ce ilustreaz˘ a conexiunile ˆ ıntr-o ret ¸ea. E.4134788)T .00000000. Prin urmare λ1 = 2.10.58118044. 0. 0.081019 ¸ si vectorul propriu de coordonate pozitive este: v = (0.62481053i Trei sunt reale ¸ si deci reprezint˘ a valori proprii ale matricii A. −0.

noiembrie 2011 5 4 0 2 3 1 Fig.3. Aceast˘ a popularitate a fost calculat˘ a¸ tinˆ and seama de num˘ arul paginilor c˘ atre care exist˘ a link din pagina 2: 1 (ai0 x0 + ai1 x1 + ai2 x2 + ai3 x3 + ai4 x4 ) λ Observ˘ am din graf c˘ a pagina 2 are cele mai multe outlinkuri(linkuri c˘ atre alte pagini) ¸ si anume. E. xi = Larry Page ¸ si Serghei Brin au realizat c˘ a indicatorul de popularitate calculat ˆ ın acest fel poate fi influent ¸at de proprietarii paginilor WEB prin ad˘ augarea a cˆ at mai multe outlinkuri. Algebr˘ a liniar˘ a.4). 0. 0.Supliment Cursul 10. De aceea au modificat regula de calcul a popularit˘ atii. 0.26744083. mai precis cu popularitatea paginilor care au linkuri c˘ atre i: .19026986) Pagina cu cea mai mare populariate este pagina 2. 0.17600973. xi . 3 (c˘ atre 0. Suma coordonatelor lui v este: a = 2.17311787 iar vectorul indicatorilor de populariate: x = v/a = (0.2: Graf orientat ce ilustreaz˘ a linkurile dintre pagini ˆ ıntr-o ret ¸ea WEB. trebuie s˘ a fie proport ¸ional˘ a cu num˘ arul de inlinkuri. Petri¸ sor. x2 = 0. consider˘ and c˘ a populariatea paginii i.10.23776522.26744083.12851436.

Vom afla cum au procedat. 0. .24962107. n λ Astfel vectorul indicatorilor de populariate satisface relat ¸ia xi = AT x = λx. Larry Page ¸ si Serghei Brin au mai introdus ¸ si alte modific˘ ari ˆ ın afar˘ a de aceasta.66870395. automat se blocheaz˘ a ”drumul de linkuri din pagina ini ¸ tial˘ a. ca ¸ si matricea A: T ) = det(A − λIn )T = det(A − λIn ).15596587. 0.40154681)T Suma coordonatelor lui v este: 2. lui v ˆ In cazul ret ¸elei din figur˘ a.07494688. T Dar matricea A este de asemenea o matrice nenegativ˘ a¸ si ireductibil˘ a¸ si are acela¸ si polinom caracteristic. 0. iar vectorul popularit˘ atii paginilor este x = v/2.060289582. 0. 0. Prin urmare se alege λ ˆ ın (10. iar vectorul v indicatorilor de populariate bazat pe num˘ arul de inlinkuri este x = . 0. cˆ and va fi soare ¸ si frumos. Algebr˘ a liniar˘ a. 2.060289582 = (0..19489824)T ˆ In acest fel pagina cu cea mai mare populariate este pagina 3. . x2 .51429169. 0. i = 1.32133486. ˆ In semestrul 2 vom avea cuno¸ stint ¸ele necesare s˘ a prezent˘ am detaliat algoritmul PageRank– Google de ierarhizare a paginilor WEB. .3) adic˘ a este un vector propriu al matricii hyperlink transpus˘ a.3) ca fiind r˘ ad˘ acina λ1 real˘ a¸ si de valoare absolut˘ a maxim˘ a¸ si v un vector propriu de coordonate strict pozitive.6 Supliment Cursul 10. E. Qn (λ) = det(AT − λIn ) = det(AT − λIn dar vectorii proprii difer˘ a. unde x = (x1 . matricea hyperlink transpus˘ a are λ1 = 2.. 1. suma coord. Petri¸ sor. . Dac˘ aˆ ıntr-o pagin˘ a exist˘ a link c˘ atre un fi¸ sier pdf al altei pagini ¸ si acesta nu cont ¸ine alte ˆ linkuri.32456794. prin luna mai. (10.15441227. un vector propriu de elemente strict pozitive este: v = (0. noiembrie 2011 1 (a1i x1 + a1i x2 + · · · + ani xn ). In acest caz cei doi au introdus un artificiu ¸ si ”au ad˘ augat” ˆ ın fi¸ sierul pdf linkuri fictive. 0. ˆ In primul rˆ and paginile WEB nu formeaz˘ a un graf conex. Qn (λ). xn )T . .081019. AT . c˘ atre ea existˆ and 4 linkuri din paginile 0. 4.

Sign up to vote on this title
UsefulNot useful