Cours de référencement : le PageRank

Mise à jour du 25 janvier 2010

Rémi Bachelet
Dernière version de ce cours de cours sur le PageRank

Cours distribué sous licence Creative Commons, selon les
conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image

École Centrale de Lille
Rémi Scientifique - Centrale de Lille Villeneuve d’Ascq Cedex 2010 Cité Bachelet – Ecole BP 48 F-59651 25 janv. Image : Source Utilisation ou copie interdites sans citation 1

Comment utiliser ce cours :
1. Mettre les diapos en format plein écran en cliquant sur 2. Faire défiler l’animation en cliquant sur les diapositives
(attention : cliquer sur une image ou un lien ouvre la page web correspondante)

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

2

Chapitre 1/1

Algorithmes de classement des pages
1. Le PageRank
• • • Modalités de calcul Fiabilité : Le TrustRank Ordre de présentation : Le SERP Rank

1. Ce que voit un indexeur
Rémi Bachelet – Ecole Centrale de Lille 3

25 janv. 2010

Utilisation ou copie interdites sans citation

Le PageRank
• « vote » d’une page pour une autre • Un processus récursif • Échelle logarithmique 0-10.
– PR (C) > PR (E), même avec moins de liens ! – Damping factor de 90%.

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Image : Source Wikimedia Commons Utilisation ou copie interdites sans citation

4

Ranking : études de cas

• • • •

http://freemind.sourceforge.net/wiki/index.php/Main_Page http://freemind.sourceforge.net/wiki/index.php/Talk:Main_Page https://sourceforge.net/projects/freemind/files/freemind-unstable/ http://www.google.fr/search?hl=fr&q=achat+fleurs

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

5

Un secret bien gardé
• Un nombre important de facteurs sont pris en compte dans le PageRank.
– Ces facteurs sont nombreux (plus de 200 d'après Google). – Par exemple
• Age du domaine (expiration = perte du PR) • Chemin d’accès

– Leur nature et leur pondération sont secrets pour limiter les chances de manipulations
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010
Utilisation ou copie interdites sans citation

6

Le SERP Rank
• C’est le résultat retourné lorsque l’on entre des mots-clé dans un moteur de recherche
 Une liste ordonnée de liens vers des pages web, associés à des textes courts (snippets)

• Le SERP rank est fonction du PageRank, mais aussi d’un grand nombre de facteurs
– On parle aussi de « Google Love »

• SERP = Search Engine Results Page
7

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

Le TrustRank
• • Méthode semi-automatique de classification "spam ou pas spam". Principe : une page « propre » ne propose pas de liens vers des pages de spam.

1. Liste de pages de référence « propres »
– après une analyse manuelle faite par un humain. Par propagation et analyse des liens entre pages, – Pas forcément une grande liste (200 sites).

1. Suivi récursif des liens 2. Degré de confiance que l'on peut attribuer à la page : un indice
– Son TrustRank (TR). – Entre 0 (spam) et 1 (page de référence)

Le TrustRank peut être utilisé :
– pour filtrer l'index d'un moteur de recherche, – pour classer les résultats d'une recherche.

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

8

La Google Dance
• Période durant laquelle Google change son algorithme et met à jour le classement des pages référencées.
– Variation de position d'une page sur un mot clé, – Nouveau PageRank – Variation du nombre de pages d’un site indexées.

• La Google Dance n'existe plus !
Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010
Utilisation ou copie interdites sans citation

9

Ce que voit un indexeur
– “Onpage”
• Code : non visible sur la page • Texte : visible sur la page

– “Onsite”
• Fichiers spéciaux : Robots.txt, Sitemap.xml • Vitesse de chargement de page • Liens internes entre les pages du site

– “Offsite”
• Backlinks • Social bookmarking

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

10

Questions ?

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

11

Rémi BACHELET

Enseignant-chercheur, Ecole Centrale de Lille

Mes principaux cours à Centrale Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données, prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au coaching pédagogique et à l'encadrement, référencement et SEO Rémi Bachelet – Ecole Centrale de Lille 25 janv. 2010
Utilisation ou copie interdites sans citation

12

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

13

Sign up to vote on this title
UsefulNot useful