La croyance populaire selon laquelle Google utilise environ 200 facteurs pour classer les pages est désormais obsolète. Grâce à une fuite spectaculaire, nous savons maintenant que Google se base sur pas moins de 14 000 facteurs. Voici un aperçu détaillé des découvertes les plus marquantes et comment elles peuvent transformer votre stratégie SEO.
Les déclarations trompeuses de Google
Pendant des années, Google a affirmé que certains facteurs n'influaient pas sur le classement des pages. Par exemple, en 2016, Gary Illyes de Google a nié l'importance de la "Domain Authority". Cependant, cette fuite révèle que la "Site Authority" est bel et bien un facteur de classement. De même, le Click-Through Rate (clics) et le Dwell Time ont longtemps été rejetés comme insignifiants par les représentants de Google. Mais les documents divulgués montrent que ces métriques sont effectivement prises en compte.
Quels sont les signaux utilisateurs de Google et leur importance ?
Le CTR et Le Dwell Time
Contrairement aux affirmations de Google, le CTR et le Dwell Time sont des éléments critiques pour évaluer la pertinence d'un site. Le comportement des utilisateurs sur les pages de résultats (SERP) et sur le site lui-même peut influencer directement le classement. Google ajuste les classements en fonction des clics et du comportement des utilisateurs, connu sous le nom de "Navboost". Les clics sont classés en trois types :
- Clics écrasés : Clics de courte durée et souvent associés à du spam.
- Clics courts : Clics de courte durée mais pouvant indiquer une réponse rapide et pertinente.
- Clics longs : Clics de longue durée, hautement valorisés car ils indiquent un contenu pertinent et engageant.
Les "Good clics" (clics significatifs) et les "Long clics" (clics de longue durée) sont positivement corrélés avec un meilleur classement. Ce comportement des utilisateurs montre à Google la pertinence et l'intérêt réel d'une page.
La Sandbox n’est pas un mythe !
La notion de "sandbox" a longtemps été controversée. Certains pensaient que c'était un mythe. Cependant, les documents indiquent qu'il existe un facteur basé sur l'âge du site, qui pourrait bien correspondre à cette sandbox. Cela signifie que les sites plus récents peuvent être temporairement désavantagés dans les classements jusqu'à ce qu'ils gagnent en autorité et en confiance.
Quel est l’impact du trafic Chrome ?
Sessions chrome et classement
Un autre aspect fascinant est l'impact des sessions Chrome sur le classement. Le nombre de sessions enregistrées par Chrome sur un site web est utilisé comme un signal de trafic important. Cela confirme que plus un site attire de visiteurs via Chrome, meilleur sera son classement général. Cela crée un cercle vertueux où un trafic accru améliore le classement, attirant ainsi encore plus de trafic.
Le boost en temps réel
Le "Real Time Boost" est un mécanisme par lequel Google augmente temporairement le classement d'un site en réponse à un pic de trafic soudain. Ce boost est souvent observé lorsque des techniques comme le traffic pop sont utilisées, montrant que Google réagit en temps réel à l'augmentation de l'intérêt pour une page.
Comment s'organise l'index de Google pour classer les sites ?
Le système de crawling et d'indexation
Google utilise un système d'indexation à plusieurs niveaux pour organiser les pages web. Il y a l'index primaire, l'index secondaire et l'index tertiaire. Chaque niveau d'indexation représente un degré de qualité et d'importance différent. Les pages dans l'index primaire sont celles qui sont les plus souvent consultées et mises à jour, tandis que celles dans l'index tertiaire sont rarement examinées et mises sur des disques moins performants.
L'impact de l'index sur les liens
Un fait crucial révélé par cette fuite est que la valeur des liens varie en fonction de l'index dans lequel se trouve la page source. Par exemple, un lien provenant d'une page dans l'index primaire aura plus de valeur qu'un lien provenant de l'index secondaire ou tertiaire. Cela implique que les liens provenant de sites à haute autorité, qui sont généralement dans l'index primaire, sont beaucoup plus puissants.
Les paramètres d'indexation des URL
Paramètre | Description |
---|---|
PagerankScore | Mesure de la popularité d'une URL. |
PriorSignal | Historique de l'URL dans l'index de Google. |
URLHistory | Suit les 20 derniers changements de l'URL, influençant ainsi sa stabilité et sa pertinence. |
Les modulateurs de classement
Les Twiddlers sont des composants logiciels spécialisés intégrés au moteur de recherche Google. Ces micro-programmes ont pour rôle d'affiner le classement des résultats de recherche en appliquant des règles spécifiques. Ils interviennent à différentes étapes du processus de recherche, certains agissant sur les résultats bruts, d'autres sur les résultats enrichis. Leur conception modulaire permet à Google d'introduire de nouvelles logiques de classement sans perturber l'ensemble du système, offrant ainsi une grande flexibilité pour améliorer continuellement la pertinence des résultats.
Twiddler | Rôle |
---|---|
ImageHostCategorizer | Évite la surreprésentation d'un même domaine dans les résultats d'images |
OfficialPageTwiddler | Favorise l'affichage en tête des pages authentiques d'entités connues |
DMCAFilter | Écarte les contenus signalés pour infraction aux droits d'auteur |
Les modulateurs de fraîcheur et de qualité
Google utilise des modulateurs appelés "Twiddlers" pour ajuster les classements en fonction de la fraîcheur et de la qualité du contenu. Le "Freshness Twiddlers” accorde un boost aux contenus récents, tandis que le "Quality Boost" dégrade les classements des pages de faible qualité. Cela signifie que la mise à jour régulière de contenu frais et pertinent peut aider à maintenir un bon classement.
Les facteurs de dégradation
Il existe également des facteurs de dégradation qui peuvent nuire au classement d'une page. Par exemple, un mauvais CTR ou une mauvaise expérience utilisateur peut entraîner une baisse de position. De plus, les pages avec des ancres de lien non pertinentes ou des liens de faible qualité peuvent être pénalisées.
Nom de domaine et thématique
Google évalue les domaines selon plusieurs tweedlers pour déterminer leur qualité et pertinence.
Facteur | Description |
---|---|
hostAge | Indique la date de première découverte du contenu par Google, influençant la confiance accordée au site. |
SiteAuthority | Évalue la qualité globale du domaine, affectant son classement. |
siteFocusScore | Mesure la spécialisation thématique du site, plus un site est spécialisé, plus il est susceptible de bien se classer dans son domaine. |
SiteRadius | Calcule l'éloignement de chaque contenu par rapport à la spécialisation thématique du site, favorisant les contenus qui restent dans la même thématique. |