Google utilise des systèmes de classement automatisés qui examinent de nombreux facteurs et signaux concernant des centaines de milliards de pages Web et d’autres contenus de son index de recherche pour présenter les résultats les plus pertinents et les plus utiles, le tout en une fraction de seconde.
Google dit améliorer régulièrement ces systèmes grâce à des tests et des évaluations rigoureux et informe les updates de ses systèmes de ranking lorsque celles-ci pourraient être utiles aux créateurs de contenu et autres.
Le nouveau guide de Google Search Ranking Systems aide à comprendre certains de ses systèmes de classement les plus remarquables. Il couvre certains systèmes qui font partie de ses systèmes de classement du Core, qui sont les technologies sous-jacentes qui produisent des résultats de recherche en réponse aux requêtes.
Il couvre également certains systèmes impliqués avec des besoins de classement spécifiques.
Vous pouvez également visiter le site « Comment fonctionne la recherche » pour comprendre comment les systèmes de classement de Google combinés à d’autres processus, fonctionnent ensemble afin que Google Search remplisse sa mission d’organiser l’information mondiale et de la rendre universellement accessible et utile.
1. BERT
Bidirectional Encoder Representations from Transformers (BERT) est un système d’IA utilisé par Google qui lui permet de comprendre comment les combinaisons de mots expriment différentes significations et intentions.
2. Systèmes d’information de crise
Google a développé des systèmes pour fournir des informations utiles et opportunes en temps de crise, qu’il s’agisse de situations de crise personnelle, de catastrophes naturelles ou d’autres situations de crise généralisées :
- Crise personnelle :Les systèmes fonctionnent pour comprendre quand les gens recherchent des informations sur des situations de crise personnelles afin d’afficher des lignes d’assistance téléphonique et du contenu d’organisations de confiance pour certaines requêtes liées au suicide, à l’agression sexuelle, à l’ingestion de poison, à la violence sexiste ou à la toxicomanie.
En savoir plus sur l’affichage des informations personnelles de crise dans la recherche Google.
- Alertes SOS :En cas de catastrophes naturelles ou de situations de crise généralisées, le système d’alertes SOS fonctionne pour afficher les mises à jour des autorités locales, nationales ou internationales. Ces mises à jour peuvent inclure des numéros de téléphone et des sites Web d’urgence, des cartes, des traductions de phrases utiles, des possibilités de dons, etc.
Découvrez comment fonctionnent les alertes SOS et comment elles font partie des alertes de crise de Google qui aident en cas d’inondations, d’incendies de forêt, de tremblements de terre, d’ouragans et d’autres catastrophes.
3. Systèmes de déduplication
Les recherches sur Google peuvent trouver des milliers, voire des millions de pages Web correspondantes. Certains d’entre eux peuvent être très similaires les uns aux autres.
Dans de tels cas, les systèmes de ranking de Google n’affichent que les résultats les plus pertinents pour éviter les doublons inutiles.
En savoir plus sur le fonctionnement de la déduplication et sur la façon de voir les résultats omis si vous le souhaitez, lorsque la déduplication se produit.
La déduplication se produit également avec les featured snippets ou extraits optimisés. Si une liste de pages Web est élevée pour devenir un extrait optimisé, Google Search ne répète pas la liste plus tard sur la première page de résultats.
Cela désencombre les résultats et aide les gens à localiser plus facilement les informations pertinentes.
4. Système de domaine de correspondance exacte
Les systèmes de classement considèrent les mots dans les noms de domaine comme l’un des nombreux facteurs permettant de déterminer si le contenu est pertinent pour une recherche.
Cependant, le système de domaine de correspondance exacte (exact match domain system) fonctionne pour s’assurer que Google n’accorde pas trop de crédit pour le contenu hébergé sous des domaines conçus pour correspondre exactement à des requêtes particulières.
Par exemple, quelqu’un pourrait créer un nom de domaine contenant les mots « meilleurs-endroits-pour-manger-déjeuner » dans l’espoir que tous ces mots dans le nom de domaine propulseraient le contenu haut dans le classement. Le système s’adapte à cela.
5. Systèmes de fraîcheur
Google a divers systèmes « Query deserves freshness » conçus pour afficher un contenu plus frais pour les requêtes où il serait attendu.
Par exemple, si quelqu’un recherche un film qui vient de sortir, il veut probablement des critiques récentes plutôt que des articles plus anciens du début de la production.
Pour un autre exemple, habituellement, une recherche de « tremblement de terre » peut rapporter des informations sur la préparation et les ressources. Cependant, si un tremblement de terre s’est produit récemment, des articles de presse et du contenu plus frais peuvent apparaître.
6. Système de contenu utile
Le système de contenu utile (Helpful Content) est conçu pour mieux s’assurer que les gens voient du contenu original et utile écrit par des personnes, pour des personnes, dans les résultats de recherche, plutôt que du contenu créé principalement pour gagner du trafic sur les moteurs de recherche.
7. Systèmes d’analyse de liens et PageRank
Google Search a différents systèmes qui comprennent comment les pages sont liées les unes aux autres afin de déterminer de quoi parlent les pages et lesquelles pourraient être les plus utiles en réponse à une requête.
Parmi ceux-ci se trouve PageRank, l’un de ses principaux systèmes de classement utilisés lors du lancement de Google. Les curieux peuvent en apprendre davantage en lisant le document de recherche original et le brevet PageRank.
Le fonctionnement du PageRank a beaucoup évolué depuis, et il continue de faire partie des systèmes de classement du Core de Google.
8. Systèmes d’information locale
Google a des systèmes qui fonctionnent pour identifier et faire ressortir les sources locales d’informations chaque fois que cela est pertinent, par exemple par le biais de ses fonctionnalités « Top stories » et « Local news ».
9. MUM
Le modèle unifié multitâche (MUM) est un système d’IA capable à la fois de comprendre et de générer du langage.
Il n’est actuellement pas utilisé pour le classement général dans la recherche, mais plutôt pour certaines applications spécifiques, telles que l’amélioration des recherches d’informations sur les vaccins COVID-19 et l’amélioration des légendes de featured snippets que Google Search affiche.
10. Neural Matching
Neural Matching ou la correspondance neuronale est un système d’IA que Google utilise pour comprendre les représentations des concepts dans les requêtes et les pages et les faire correspondre les uns aux autres.
11. Systèmes de contenu original
Google Search a des systèmes pour s’assurer qu’il montre le contenu original en évidence dans les résultats de recherche, y compris les rapports originaux, avant ceux qui le citent simplement.
Cela inclut la prise en charge d’un balisage canonique spécial que les créateurs peuvent utiliser pour aider Google à mieux comprendre quelle est la page principale si une page a été dupliquée à plusieurs endroits.
12. Systèmes de rétrogradation basés sur la suppression
Google a des règles qui permettent la suppression de certains types de contenu. S’il traite un volume élevé de ces suppressions impliquant un site particulier, il utilise cela comme un signal pour améliorer ses résultats. En particulier :
- Suppressions légales : Lorsque Google reçoit un volume élevé de demandes valides de suppression de droits d’auteur impliquant un site donné, il est en mesure de l’utiliser pour rétrograder d’autres contenus du site dans ses résultats.
De cette façon, s’il y a d’autres contenus contrefaits, les gens sont moins susceptibles de les rencontrer par rapport au contenu original. Il applique des signaux de rétrogradation similaires aux plaintes concernant la diffamation, les produits contrefaits et les renvois ordonnés par un tribunal.
- Suppressions d’informations personnelles : Si Google traite un volume élevé de suppressions d’informations personnelles impliquant un site ayant des pratiques de suppression abusives, il rétrograde d’autres contenus du site dans ses résultats.Il cherche également à voir si le même modèle de comportement se produit avec d’autres sites et, si c’est le cas, il applique des rétrogradations au contenu de ces sites.
Il peut appliquer des pratiques de rétrogradation similaires pour les sites qui reçoivent un volume élevé de suppressions de contenu de doxxing.
De plus, il a des protections automatiques conçues pour empêcher les images personnelles explicites non consensuelles de se classer en bonne place en réponse aux requêtes impliquant des noms.
13. Système d’expérience sur la page
Les gens préfèrent les sites qui offrent une excellente expérience sur la page (Page Experience).
C’est pourquoi Google a un système d’expérience sur la page qui évalue une variété de critères, tels que la rapidité de chargement des pages, la convivialité mobile, si les pages manquent d’interstitiels intrusifs et si les pages sont servies de manière sécurisée.
Dans les situations où il existe de nombreuses correspondances possibles avec une pertinence relativement égale, le système permet de donner la préférence au contenu avec une meilleure expérience sur la page.
14. Système de classement des passages
Passage Ranking ou le classement des passages est un système d’IA que Google utilise pour identifier des sections individuelles ou des « passages » d’une page Web afin de mieux comprendre la pertinence d’une page pour une recherche.
15. Système d’évaluation des produits
Le système d’évaluation ou des avis sur les produits (Product reviews system) vise à mieux récompenser les critiques de produits de haute qualité, le contenu qui fournit une analyse perspicace et une recherche originale, et est écrit par des experts ou des passionnés qui connaissent bien le sujet.
16. RankBrain
RankBrain est un système d’IA qui aide Google à comprendre comment les mots sont liés aux concepts.
Cela signifie que Google peut mieux renvoyer un contenu pertinent même s’il ne contient pas tous les mots exacts utilisés dans une recherche, en comprenant que le contenu est lié à d’autres mots et concepts.
17. Systèmes d’information fiables
Plusieurs systèmes fonctionnent de différentes manières pour afficher les informations les plus fiables possibles, par exemple pour aider à faire apparaître des pages plus fiables et rétrograder le contenu de mauvaise qualité et élever le journalisme de qualité.
Dans les cas où des informations fiables pourraient manquer, les systèmes de Google Search affichent automatiquement des avis de contenu sur des sujets qui changent rapidement ou lorsque ses systèmes n’ont pas une grande confiance dans la qualité globale des résultats disponibles pour la recherche.
Ceux-ci fournissent des conseils sur la façon de rechercher de manière à conduire à des résultats plus utiles. En savoir plus sur l’approche de la fourniture d’informations de haute qualité dans la recherche.
18. Système de diversité des sites
Le système de diversité de site (site diversity system) fonctionne de sorte que Google n’affiche généralement pas plus de deux listes de pages Web du même site dans ses meilleurs résultats, de sorte qu’aucun site n’a tendance à dominer tous les meilleurs résultats.
Cependant, Google Search peut toujours afficher plus de deux listes dans les cas où ses systèmes déterminent qu’il est particulièrement pertinent de le faire pour une recherche particulière
La diversité des sites traite généralement les sous-domaines comme faisant partie d’un domaine racine. Par exemple : les résultats d’un sous-domaine (subdomain.example.com) et du domaine racine (example.com) seront toutes considérées à partir du même site.
Cependant, les sous-domaines sont parfois traités comme des sites distincts à des fins de diversité lorsque cela est jugé pertinent.
19. Systèmes de détection de spam
Personne ne veut que sa boîte de réception soit remplie de spam, c’est pourquoi les filtres anti-spam sont si utiles.
La recherche est confrontée à un défi similaire, car Internet contient d’énormes quantités de spam qui, si elles ne sont pas traitées, empêcheraient d’afficher les résultats les plus utiles et les plus pertinents.
Google Search utilise une gamme de systèmes de détection de spam, y compris SpamBrain, pour traiter le contenu et les comportements qui enfreignent les politiques anti-spam. Ces systèmes sont constamment mis à jour pour suivre les dernières façons dont la menace de spam évolue.