Origine du SEO, historique de Google

Mise à jour du 25 janvier 2010

Rémi Bachelet
Dernière version de ce cours de cours de référencement / SEO

Cours distribué sous licence Creative Commons,
selon les conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image

École Centrale de Lille RémiScientifiqueEcole Centrale de Lille Cité Bachelet – - BP 48 F-59651 Villeneuve d’Ascq Cedex 2010 25 janv.
Image : Source Utilisation ou copie interdites sans citation 1

Comment utiliser ce cours :
1. Mettre les diapos en format plein écran en cliquant sur 2. Faire défiler l’animation en cliquant sur les diapositives
(attention : cliquer sur une image ou un lien ouvre la page web correspondante)

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

2

Origine du SEO
1. Les premiers moteurs de recherche
• Les algorithmes d’indexation

1. Google … et ses concurrents

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

3

Histoire du SEO
• • Au début pas de moteurs de recherche, mais des engins spécialisés (the Wanderer mesure la taille du web, Gopher est un protocole de classement) ou de simples indexeurs (Archie indexe les fichiers disponibles en ftp). Premier moteur de recherche : Aliweb en 1993
1. On déclare ("to submit") l’adresse d’une page = son URL (Uniform Resource Locator), à divers moteurs de recherche 2. Le moteur envoie un "crawler" une “spider” télécharger la page La page est stockée sur le serveur du moteur de recherche… 3. … où elle est traitée par un indexeur pour en extraire les informations (motsclés, liens) et les interpréter (importance, répétition…). 4. par la suite, le "crawler" revient sur la page pour actualiser les informations.

Au milieu des années 1990, le problème de l'indexation des sites web pour les rendre plus faciles à trouver émerge car la visibilité d’un site devient un facteur de plus en plus important : le SEO ("search engine optimization") émerge en tant que champ de compétence
– Apparition du terme vers 1997 selon Danny Sullivan

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

4

Premiers algorithmes d’indexation
Aliweb requiert des fichiers "index", qui sont placés spécialement par les webmestres et qui y déclarent l'adresse de leur pages, les mots-clés associés …
– Mais ensuite les moteurs de recherche se basent sur des mots-clés insérés dans le code des pages

 Ce sont les étiquettes méta ou "meta tag"
– Limites de l’utilisation des meta tags comme indicateurs de la pertinence des pages :
• Les webmestres y mettent des mots-clés sans rapport avec le contenu réel du site dans le but d'attirer du trafic = "spamdexing", "black hat" • .. résultat : à cette époque trouver la bonne page web est une aventure…

 Les premiers moteurs de recherche sont facilement manipulés et discrédités.
• .. De nouveaux algorithmes de recherche plus difficiles à manipuler sont développés… • La course entre les moteurs de recherche et ceux qui veulent manipuler les résultats de recherche s'engage…
Rémi Bachelet – Ecole Centrale de Lille
25 janv. 2010
Utilisation ou copie interdites sans citation

5

Google : les débuts
• Des étudiants de Stanford, Larry Page et Sergey Brin développent "backrub," un moteur de recherche basé sur un algorithme baptisé PageRank
– PageRank = nom de l'inventeur, Larry Page

• •

L'algorithme calcule un indice basé sur les liens entrants :
– PR(page X) = Σ PR(des pages qui donnent un lien vers X)

Le principe n'est pas nouveau
– Utilisé en recherche : citation index. On mesure l'importance d'un article au nombre de fois qu'il est cité dans d'autres articles. – Le moteur de recherche Inktomi utilise déjà ce principe – … et déjà des webmestres ont développé des manières de le manipuler

Google est fondé en 1998.
– Le moteur de recherche est :
• Dépouillé (page légère) • Simple (recherche "et" par défaut) • Rapide

… et il devient très rapidement populaire (en quelques semaines)
Rémi Bachelet – Ecole Centrale de Lille
25 janv. 2010
Utilisation ou copie interdites sans citation

6

Google, les chiffres :
– – – – – Un index de plus de 24 milliards de pages (2007) 20 000 employés dans le monde (sept 2009) Plus de 110 sites régionaux Plus de 130 interfaces linguistiques Plus de 3 milliards de requêtes et 16 millions de visiteurs uniques par mois (2007) – Slogan « Don't be evil »
• Eric E. Schmidt, directeur • Sergey Brin, directeur technique • Larry E. Page, directeur produits

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

7

Le chiffre d'affaires de Google.

22 milliards de dollars de liquidités au 30 septembre 2009 Les bénéfices nets
Rémi Bachelet – Ecole Centrale de Lille
25 janv. 2010 Source le Monde 16.10.09 Utilisation ou copie interdites sans citation 8

Google sur le marché des recherches
• En mai 2009, dans le monde
– 68,6 %, – devant Yahoo! (9 %) – Baidu (8,7% - chinois).

• 85% à 90% de parts de trafic en Europe • Sur le marché américain 65 %
– 19,6 % pour Yahoo! – 8,4 % pour Microsoft.

Source : ComScore
Rémi Bachelet – Ecole Centrale de Lille
25 janv. 2010
Utilisation ou copie interdites sans citation

9

Mais Google, c’est plus qu'un moteur de recherche…
Google Earth, Analytics, Webmasters Tools, Gmail, Youtube, Wave …
– le modèle opposé à celui de Microsoft : on est prisonnier de MS contre son gré, essentiellement à travers l’absence d’alternative et la noninteropérabilité
• En plus, on est obligé de payer ….

– avec Google on devient dépendant … en choisissant d’utiliser des applications innovantes ..
• ..et gratuites… (ce « gratuit » ne l’est bien sûr pas réellement, il fait
partie du modèle économique).

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

10

Politique d'acquisition de technologies
• • • • • • • • • Deja => Google Groups Picasa => Picasa Keyhole, Inc => Google Earth Urchin Software, Measure Map, Trendalyzer, => Google Analytics Android => Android Phatbits => Google Desktop YouTube => YouTube (1.6MM$) FeedBurner => Google Reader Upstartle, Zenter, Tonic Systems, 2Web Technologies => Google Documents • JotSpot => Google Sites • Marratech => Google Talk

Source

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

11

Analyse du succès de Google
• • • • • • Le bon timing Une philosophie : « Google attitude », Googleplex Rupture technologique Rapidité, simplicité ("et" par défaut entre les mots-clés) Pages de résultats dépouillées (sans publicité au début) Une parfaite compréhension de la culture du Web
– Gratuité – Affinités avec l'Opensource – Innovation constante

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

12

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Image citation Utilisation ou copie interdites sans : Source

13

Les concurrents de Google
• • • • Yahoo! Search, Microsoft Live Search / Bing Les outsiders : Exalead, Ask.com Les annuaires et moteurs thématiques / régionaux
– DMOZ – Une myriade de "micro" moteurs expérimentaux…

• De nouveaux venus ?
– Mais le coût d'entrée n'est-il pas aujourd'hui devenu énorme ?

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

14

Google comme étalon universel

• Dans beaucoup de pays, le référencement naturel est devenu une « chasse au classement Google »
– Effet superstar – Les nouvelles formes de réseaux sociaux du référencement : news, scholar, twitter, slashdot

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

15

Google Universal Search
• Depuis mai 2007, une recherche sur Google propose sur sa search engine results page (SERP) des résultats mixant :
• Certes
– des Pages web – Des liens sponsorisés

– Mais aussi
• • • • • • • Actualités, Images, Livres Cartes Blogs Vidéos Définitions (define:)

 Avec Universal Search, des contenus auparavant séparés sont présentés simultanément  Résultat :
 encore plus de candidats à la première page  Des stratégies alternatives pour y figurer

Une évolution incessante
 Par exemple : Sept 2009 : nouvelle version du moteur de recherche en test

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

16

Google, les vulnérabilités
• Modèle économique = le gratuit + les effets d’échelle
– Un CA dépendant à 98% du marché des liens sponsorisés – Non-rentabilité de Youtube et de nombreux autres services … – Risque de dispersion

• Fraude aux clics sur les pubs adwords • De plus en plus de questions sur
– La sécurité des données – la vie privée des utilisateurs

• Google et la crise • Microsoft et Yahoo! ont lancé, en juillet 2009 un partenariat destiné à concurrencer Google dans la recherche sur Internet.
– Microsoft, avec Bing, fournira la technologie – Yahoo! la vente d'espaces publicitaires

En terme d’image Google est encore le « chevalier blanc » face à Microsoft, mais un risque : en cas d’impair, la déception sera à la mesure de l’engouement
17

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

Questions ?

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

18

Rémi BACHELET

Enseignant-chercheur, Ecole Centrale de Lille

Mes principaux cours à Centrale Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données, prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki, formation au coaching pédagogique et à l'encadrement, référencement et SEO

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

19

Rémi Bachelet – Ecole Centrale de Lille

25 janv. 2010

Utilisation ou copie interdites sans citation

20