You are on page 1of 31

Les Graphes WEB et Référencement

Réalisé par :
•EL KABIR Fatima
•ELHAJIBI Safa Supervisé par:
•ES-SAYEDI Soumaia Mr .NOKRANE
•HATIM Salma
•KARKORI Fadwa
Année universitaire 2022-2023
INTRODUCTION

Qu’est-ce que le Web ?

Le web est généré par un consortium mondial


: Worl Wide Web Consor​tium.

Cet organisme international indépendant


définit les formats normalisés.

Ce sont les protocoles du WEB. Ces règles


assurent une circulation standardisée des
informations

2
INTRODUCTION

Qu’est-ce que le Web ?

Le Web c’est à dire le World


Wide Web est simplement le
système qui permet de naviguer
de page à une page.

3
INTRODUCTION
Qu’est-ce que le Web ?

Le Web était caractérisé à la fois par un


protocole (le http) et un langage (le html,
HyperText Markup Language).

Le premier servant à diffuser des« pages »


(des fichiers) écrites , et interprétées du
côté client par des navigateurs Web
(Browsers).

4
INTRODUCTION

Profondeurs du Web

The Surface Web : The Deep Web : à l’inverse, le


la surface du Web, est Web profond consiste en des sites
constituée de l’ensemble des web dynamiques et des bases de
pages statiques et données accessibles par interface
publiquement disponibles. Web.

5
Visibilité du Web

The Opaque Web : The Private Web :

Les pages qui pourraient être indexées par les Les pages webs disponibles mais
moteurs mais qui ne le sont pas (limitation volontairement exclues par les
d’indexation du nombre de pages d’un site, webmasters (mot de passe,
fréquence d’indexation, liens absents vers des fichiers dans la page pour que le
pages ne permettant donc pas un crawling). robot du moteur ne l’indexe pas).

6
Visibilité du Web

The Truly InvisibleWeb : contenu The Proprietary web : pages


qui ne peut être indexé pour des accessibles seulement pour les
raisons techniques. Par personnes autorisées ( système
exemple, format inconnu par le d’identification. . . ).
moteur, pages générées
dynamiquement .

7
Les graphes et les sous graphes dans le Web

Un graphe est une


représentation d’un ensemble
d’objets ou de personnes
(points, nœuds, sommets…)
reliés par des segments (arcs,
flèches, liens…) permettant
de visualiser un réseau

Les graphes sont souvent utilisés


pour représenter des interactions…

8
Le Web comme un tout

Un ensemble de pages web et de Il est composé de multiples sous-


médias web reliés dans un graphes, qui comprennent à leur tour de
immense graphe par des liens. multiples sous-sous-graphes.

9
PLAN DE PRESENTATION 04
Récapitulation

03
et
Applications dans
Conclusion .
exemple de
GOOGLE
(Réferenecement)

LES
GRAPHES
02
ALGORITH
WEB ME
(Définitions) PageRank

0
(Définition et
exemple de
Google)

1
10
LES GRAPHES WEB (Définitions)

On appellera graphe Web le graphe


orienté
G = (V, E), où V est l’ensemble
des pages, visitées ou non, et tel
qu’un arc e ∈ E relie une page i à
une page j

11
LES GRAPHES WEB (Définitions)

P Tout d’abord il faut voir le Web comme


1 un graphe. Chaque page est un nœud du
graphe, chaque lien entre les pages est
un arc entre deux nœuds.

P
P 5
2

P
Comment les pages web
4 sont classées ?
P
3

12
Bref historique du PageRank de Google

 L’idée de PageRank est officiellement


présentée pour la première fois en
1998 par Sergey Brin et Larry Page.

 Lawrence Edward Page dit Larry Page,


né le 26 mars 1973 , est un
informaticien américain, cofondateur
du site internet et moteur de recherche
Google avec Sergey Brin.

 Sergey Brin , né le 21 août 1973 à


Moscou, est un entrepreneur
américain d'origine russe, cofondateur
avec Larry Page de la société Google.

13
Définition de L’algorithme PageRank :

Icon
 le PageRank est une question de
liens.

 On peut le décrire comme un


Icon
moyen de mesurer l'importance  Le PageRank est un système de
d'une page web en analysant la classement des pages web.
quantité et la qualité des liens qui
y pointent.
Icon  l'algorithme original que Google
a utilisé pour calculer
l'importance d'une page web et
la classer.

15
Comment fonctionne le PageRank ?

il est basé sur la


théorie selon laquelle
un lien d'un site Web
à un autre constituait
un vote de confiance
et d'autorité.
plus il y a de liens
(votes) qui pointent
vers une page, plus il
faut lui faire
confiance

Lui donner un
meilleur classement

15
Comment fonctionne le PageRank ? :

 La formule du PageRank d’une page :

: probabilité de chaque page a être choisie


PR(p) = (1- p)/n + p Σ
P : probabilité de choisir un lien

n : nombre de pages

16
Etude du fonctionnement du PageRank
Google :

Graphe directionnel
en entrée

PageRank

PR(A)

PR(C) Méthode analytique:


PR(B) « n » pages web système à « n » équations
Graphe avec des PageRank à « n » inconnus
en sortie
Equation matricielle 17
Google traite plus que 130 000 000 000 000 de pages Web.

Méthode analytique

Matrice de 16900 000 000 000 000 000 000 000 000 éléments!!

Stockage ?!

Méthode approximative

18
Méthode approximative

19
Méthode approximative

20
Méthode approximative

= 0,214

= 0, 387
= 0, 397 PageRank calculés, triés et montrés au utilisateur.

21
Méthode approximative : Exemple

A B

PR(P) = C
D

Itération 0 Itération 1 Itération 2 Page Rank

A 1/4 1/12 1,5/12 4

B 1/4 2,5/12 2/12 3

C 1/4 4,5/12 4,5/12 1

D 1/4 4/12 4/12 2

22
Important translated words

• Un graphe a graph
• Un sommet a top
• Un arc an arc
• Un lien a link
• The topic le sujet principal
• The global warming le réchauffement climatique

23
The topic googled is
‘’ the global warming ’’

24
A non-oriented graph that connects between the pages (the
tops) about the « the global warming » topic by the links (the
arcs)

A C
D
E
B
The Simplified
formula
PR(P) =

25
Results of the Page Ranking
Itération 0 Itération 1 Itération 2 Page
Ranking
A 1/5 1/10 1/20 5
B 1/5 1/10 3/20 3
C 1/5 2/10 2/20 4
D 1/5 3/10 6/20 2
E 1/5 3/10 7/20 1

26
The topic googled is ‘’ global warming ’’

Britannica.com Nrdc.org Climate.nasa.gov

PageE Page B
Page D

Nationalgeographic.org Wikipedia.org

Page C Page A

27
The topic googled is
‘’ the global warming ’’

28
Récapitulation et conclusion

Le PageRank est un algorithme itératif qui permet d’estimer la popularité


d’un site Web à partir de ces backlinks .

PageRank d’une page :

29
Récapitulation et conclusion

Le PageRank compte histroriquement parmi les facteurs clé


de réussite de Google dans le marché conccurentiel des
moteurs de recherche.

30
Merci pour votre attention

You might also like