Evolution de la recherche sur le World Wide Web

Par Maurice Largeron

Consultant Formateur Marketing Digital chez MLConseil depuis 2011. Agence Google Partner. Organisme Certifié Qualiopi.

21 septembre 2014

Petit retour cette semaine  sur une  histoire de l’internet et des moteurs de recherche .  La connaissance du passé nous fait mieux comprendre ce qui se déroule aujourd’hui  et participe à une meilleure  anticipation de  ce qu’il va advenir ! Voilà pour la bonne parole 🙂 . Parler d’optimisation pour les moteurs de recherche, c’est d’abord parler des  moteurs en eux même puis ensuite des usages que vont en faire ses utilisateurs  depuis le début des années 2000 (référenceurs entre autres).  Tout un écosystème encore en pleine adolescence  et qui doit sans cesse se renouveler (la disparition de l’authorship dernièrement en témoigne).

Histoire des moteurs, il était une fois les années 1990

Début : 1990 – 1993 : les balbutiements

  • Archie =  1990 premier moteur dont son indexation est fait de listes de répertoires téléchargeables mais les contenus ne le sont pas par manque de place mémoire.
  • Gopher en 1991, ce système recense des noms de fichiers et des titres
  • Vlib – 1992  = Tim Berner Lee, Inventeur du » http://www «  met en place une bibliothèque virtuelle. Le CERN héberge une liste de serveurs web avant l’avènement de l’internet.
  • 1993 : Création du moteur excite qui sera plus tard en 1999 revendu, puis connaîtra la faillite.
  • Naissance d’un bot « www wanderer” par Matthew gray qui mesure l’expansion du web et scraper les urls (Wandex sera le nom de la base de donnée qui collecte l’activité du crawler)
  • Aliweb : à l’automne 1993, ce moteur crée par Martin Koster permettra de soumettre des pages et récupère les méta- description. On notera l’émergence de robots tels que ceux que l’on connait aujourd’hui (urls, titre, scoring de pages)
Timeline moteurs de recherche 1990 - 2014

Timeline moteurs de recherche 1990 – 2014

1994 – 1998 : Génèse  des grands acteurs

  • Naissance de moteurs d’envergure mondiale avec Infoseek (soumission de page en temps réel) et altavista. Apparition de webcrawler qui scanne des pages entières, plus tard aol rachètera ce moteur.  C’est  Yahoo ! qui débarque, crée par David Filo et Jerry Yang, ce moteur est  en partie tenu par des vrais humains ! C’est aussi la période de Lycos qui établit un ranking par pertinence, plus de 60 millions de documents sont indexés, un record jamais atteint
  • 1995 : looksmart challenge yahoo ! dans le scoring, ce moteur connaitra des heures de gloire à la fin de la décennie dans le giron de Microsoft (à l’époque connu sous MSN). Un an Hotbot qui va instaurer un modèle payant pas aussi efficace que celui de Yahoo ! (qui rachètera en 2003 ce moteur).
  • 15 Septembre 1997 : Naissance de Google ! 2 Etudiants de Sandford serge brin et Larry page bricole un moteur de recherche..dans un garage prêté par une amie. As déboule dans la folle ruée vers le web et lance un moteur basé sur le langage naturel, il est facilement “spamable” selon les référenceurs !
  • L’année 98 voit l’entrée en lice du moteur « MSN », Google fait ses premières armes .  C’est également l’époque de Dmoz, cet open directory qui répertorie  par des vrais humains des sites web. Cet annuaire envoie un signal positif aux moteurs, d’où son intérêt d’y être inscrit. Il sera racheté par Netscape, puis indirectement par AOL.

1999 – 2005 : Il n’en restera qu’un !

Google est choisi comme partenaire par AOL.  Yahoo ! collabore aussi avec Page et Brin. Les premières publicités Adwords se font sur un modèle au cpm.  Goto.com , devenu Overture  entre en  bataille pour le brevet d’un modèle au cpc. Un duel est engagé entre les 2 américains ou Google est accusé de plagiat de brevet.  Alltheweb  se fait racheter également par Overture qui à son tour devient propriété de Yahoo ! 2003 : ce dernier utilisera la techno. d’ ATW pour son portail  d’information. Entre les années 2003 et 2005  est une période de consolidation des  acteurs avec rachats multiples par les acteurs dominants de l’époque (Yahoo !, MSN, Ask)

2005 – 2014 l’époque des initiatives

  • 2005 : Le propriétaire d’overture lance le moteur SNAP, reconnu pour être trop complexe dans son interface.
  • 2006 : Microsoft lance une nouvelle interface de son moteur.
  • 2008 :  Cuil est lancé par des anciens employés de Google.
  • 2009 : Bing devient le nouveau porte-drapeaux de la recherche made by Bill Gates.
  • 2012 : Un italien tente de relancer le look des résultats de recherche avec son moteur Volunia.
  • 2013 : C’est au tour de la France d’y croire avec le lancement de Qwant. (à janvier 2014 : 507 million de requêtes) reste à déterminer sa part de marché en cette rentrée 2014.

Timeline du cœur de Google : évolution de son algorithme

J’ai partagé en 2 périodes, pour des raisons pratiques de largeur de timeline ! Sinon, on pourrait aussi y voir dans cette scission entre la première décennie et celle qui suit, la volonté  de Google pour la période qui commence en 2011,  d’affirmer son combat contre le spam, avec une réelle cassure avec la succession de Panda et Pingouin..Mais la lutte et l’évolution du moteur contre le spam ne démarre pas en 2011, loin sans faut, dès les premières années de Google, la sur-optimisation des contenus pour les crawlers prend place. Cette richesse  apportée par les usages des référenceurs, leur pratique dans la trituration du moteur,  enrichit au fil des updates l’ingénierie de ce grand scraper mondial.

2000 – 2010 : Google dance et avènement des « updates »

  • 2000 : Barre d’ outils Google a installé comme un addons sur les navigateurs, pas vraiment une maj. Ici, certes mais un outil d’aide à la recherche de pages web, indicateur de Page Rank, surligneur etc..
  • 2002 : Before boston est une des premières communications sur les MAJ de G. officielle. Jusqu’à lors, les fluctuations dans les résultats de recherche (serp) était dénommée « Google Dance » : soubresauts étalés le temps avec des mises à jour mensuelles de ses  index dans ces Datacenters  et des évolutions algorithmiques. Google Dance prendra aussi une signification signifiant une m.a.j du Page Rank d’un domaine.
  • 2003 : 6 MAJ !  Pas moins de 6 nominés pour cette année : Boston (1er nom donné à 1 mise à jour)  – Cassandra (texte et liens cachés)- Dominic (backlinks)  – Esmeralda  (infrastructure)  Fritz (marque la fin des G. Dance) – Florida (marque un coup d’arrêt aux techniques seo des 90’s : bourrage mots clés par exemple)
  • 2004 : 2 MAJ : Austin (suivi de Florida)  & Branda (ancre de texte, LSI (sémantique), élargissement de l’index.
  • 2005 : NoFollow (Yahoo ! MSN et G. introduise cet attribut sur les liens)  and Allegra (pénalités sur liens spammy ?) – Bourbon (duplicate & non canonical traitement) – Xml Sitemaps (dans Google webmaster tool) – Jagger (Liens – Spam) – big Daddy (infrastructure)
  • 2007 : Buffy (changements mineurs, mais lesquelles ? Mystère..)
  • 2007 : Recherche Universelle avec  intégration de résultats de sources div. (actus, vidéos, images, local)
  • 2008 : Dewey  ( ??) et Google Suggest (présence des requêtes les plus fréquentes au moment de la frappe de l’internaute)
  • 2009 : Vince (bon signal pour les marques, rendues plus faciles d’accès ) et Caffeine (infrastructure datacenter, Augmentation de la   Vitesse du crawl,  indexation temps réel)
  • 2010 : May Day (Impactera la « long tail »)  et Caféine (solde) – Google Instant (impressionnant à l’usage, avec des résultats qui s’affichent en cours de composition de la requête)
Historique Algo. Google 2000-2010

Historique Algo. Google 2000-2010

2011 – 2014 : Le Zoo de Google se veut durable !

  • 2011 :Panda (fermes de contenus, excès de pub) & Schema,org (méta communes pour les acteurs de la recherche avec  standard pour données structurées)  & Freshness (35% des requêtes)
  • 2012  :Pingouin : Cela y est ! Pénalités pour les sur-optimisations (cloaking, linking) mais possibilité de retrouver des positions perdues si nettoyage de profils spammy effectués.
  • 2012  : Knowledge Graph : approche sémantique du moteur qui délivre une réponse directe ou des liens  (wiki, universitaires)  dans son moteur suite à une requête sur des objets comme des  états, personnes, définitions de termes.
  • 2012 : Exact Match Domain update sur sa base de noms de  domaines  reliés à  des thématiques concurrentielles.
  • 2012 : Mesures sur excès d’Affichage publicitaire au-dessus lignes de flottaison (google fait la loi ici, il est juge et partie).
Evolution Algorithme recherche G. 2011-2015

Evolution Algorithme recherche G. 2011-2015

  • 2012 : Venice (Seo local) : apparition de pages  organiques localisées qui ouvrent un champ plus grand au seo local.
  • 2013 : Phantom ( ??)  & PayDay : pénalité sur les sites sur-optimisés sur des thématiques concurrentielles à fort trafic (ici secteur : adulte)
  • 2013 :  In Depth Articles (filtres sur articles longs)
  • 2014 : Perte des photos de l’auteurShip : pas marrant, j’aimais voir ma photo 😉
  • 2014 : Pigeon, un autre animal du Zoo Californien  qui impacte le Seo Local avec un remaniage aux Us et  filtres nouveaux sur les Packs 1 à 7. Assainir les résultats locaux, diminuer les effets ostentatoires des résultats (pas trop d’étoiles, de couleurs sur les pictos, moins de pack 7,  etc. ..)
  • 2014      Google apporte une préférence au signal de cryptage sur le protocole httpS://

Bien sûr, Panda et Pingouin sont dans les cages pour un moment, ils sont nourris au fil des jours par leur maître, mais également par les visiteurs de la ménagerie.  L’actualité est marquée par des mises à jour constantes.

Sources :

En savoir plus sur ce sujet…

Pin It on Pinterest