Comment le machine learning aide Google à classer les sites Web ?

au début des années 2010, il semblait effrayant au début.

Comment le machine learning aide à classer les sites Web ?

et nous avons réalisé comment la technologie est déjà utilisé pour nous fournir des solutions), nous avons commencé à nous poser les questions pratiques pour le :

  • Comment les moteurs de recherche utilisent-ils le machine learning ?
  • Comment va-t-il affecter le référencement Web ?

s’est lui-même déclaré comme une entreprise -first en Juin 2016.

Si vous voulez en savoir plus sur le côté tactique de cette technologie, Eric Enge a rédigé un article complet sur Moz

Détection des motifs

assemblé des attributs communs du contenu de faible qualité, tels que :

Même si il y a encore des évaluateurs humains de la qualité (Quality Raters), le machine learning a aidé Google à automatiquement passer au crible les pages pour éliminer les pages de faible qualité sans intervention humaine.

en théorie).

Identification de nouveaux signaux

Selon un podcast de 2016 fait avec Gary Illyes de chez Google, non seulement RankBrain aide à identifier les modèles dans les requêtes, il aide également le moteur de recherche à identifier les nouveaux signaux de classement possibles.

Ces signaux sont recherchés afin que Google puisse continuer à améliorer la qualité des résultats de la recherche.

plus de signaux de Google pourraient être gérés par le machine learning.

Le machine learning est pondéré comme une petite partie

actuellement) sur les pages de résultats.

fournir aux utilisateurs une meilleure expérience.

Signaux personnalisés basés sur une requête spécifique

Le machine learning dans les moteurs de recherche peut varier selon la catégorie de la requête ou le phrasé, selon une étude réalisée en Juillet 2017

Les chercheurs ont utilisé le moteur de recherche russe Yandex pour analyser les résultats pour différentes requêtes. Ils ont constaté que les types de résultats affichés dépendaient en grande partie de la catégorie de la requête ou du phrasé.

CTR10%.

et pourrait avoir fondé ses informations sur les requêtes passées (ou récentes) pour présenter les informations les plus intéressantes possibles.

Un exemple de ce qui est souvent utilisé dans les présentations de conférence est une série de requêtes en une seule séance et comment les résultats changent en fonction de ce que vous avez cherché par le passé.

Par exemple, si on recherche \ »New York Football Stadium\ » dans un navigateur incognito, on reçoit la réponse : “MetLife Stadium”.

Ensuite, si on recherche dans le même navigateur pour juste \ »Jets\ », Google va supposer que parce que la dernière question a été sur un stade de football, alors cette question est aussi sur le football.

Et plus on poursuit la recherche en saisissant d’autres requêtes, plus Google apprend (sait) si l’on est passé à autre chose.

La recherche du terme \ »Jaguars\ »liés aux deux dernières recherches).

\ »zoo près de San Diego\ », puis on commence à taper \ »Zoo\ » à nouveau dans la boîte de recherche, Google suggère \ »zoos avec jaguars\ », 

Google Images pour comprendre les photos

Retour en 2013, il a été rapporté que les utilisateurs de Flickr téléchargeaient 1,4 million de photos par jour, pendant que 40 millions étaient téléchargées sur , et les utilisateurs de en téléchargeaient 350 millions.

Bien que ces statistiques ont probablement augmenté (il était difficile de trouver des données de comparaison plus récentes), cela montre quel volume de photos doit être catégorisé et analysé sur le Web tous les jours.

résultats de Google Image Search).

Les utilisateurs peuvent alors trouver d\’autres instances de la photo en ligne, ainsi que des photos similaires qui ont les mêmes sujets ou palettes de couleurs et des informations sur les sujets de la photo.

Source : Searchenginejournal.com

Identification des similitudes entre les mots dans une requête

Non seulement les données des requêtes sont utilisées par le machine learning pour identifier et personnaliser les requêtes ultérieures

Google Trends est un excellent exemple de ce point de vue.

par exemple “planche” ou “il est allumé”) peut avoir des résultats de recherche absurdes.

Toutefois, comme son phrasé (

Comme le langage se développe et se transforme, les machines sont mieux en capacité de prédire nos significations derrière les mots que nous disons et nous fournir de meilleures informations.

Améliorer la qualité publicitaire et cibler les utilisateurs

Selon les brevets Google US20070156887 et US9773256

), les seuils de classement des annonces (Ad Rank), le contexte de la recherche de la personne, sont introduits dans le système sur une base de mot-clé par mot-clé, pour déterminer quels seuils sont considérés par Google pour chaque mot clé.

Identification des synonymes

visible en gras habituellement), il est probablement dû à Google utilisant RankBrain pour identifier les synonymes.

Clarification des requêtes

Les utilisateurs peuvent effectuer une recherche pour acheter (recherche transactionnelle), pour trouver des informations (recherche informationnelle), ou pour trouver des ressources (navigation) pour toute recherche donnée.

En analysant les modèles de clics et le type de contenu que les utilisateurs engagent avec, par exemple le CTR par type de contenu, un moteur de recherche peut .

), plus les humains interagiront avec lui, plus il deviendra plus précis et “plus intelligent” au fil du temps.

Auteur : Noel NGUESSAN

Je suis Noel Nguessan, fondateur du site Arobasenet.com qui existe depuis 2007 et a aujourd'hui plus de 6.800 articles. Pour ma part, j'ai intégré le monde de l'internet en 1997 en qualité de créateur de site internet, avant de devenir développeur web et multimédia au début de l'année 2000, avant de basculer naturellement vers le SEO en tant que Consultant.