14 Signaux utilisés par Google pour évaluer E-A-T sur un site

Nous savons que Google veut récompenser le contenu et les entités (comme les organisations et les marques) qui démontrent des niveaux élevés d’expertise, d’autorité et de confiance (E-A-T).

14 Signaux utilisés par Google pour évaluer E-A-T sur un site

 

Nous savons également que Google nous conseille de nous familiariser avec ses guidelines d’évaluation de la qualité, en particulier lorsqu’il s’agit de mises à jour générales du core de l’algorithme.

Ce que nous ne savons pas avec 100% de certitude, c’est comment Google transforme E-A-T – qui est un concept, pas un facteur de classement direct ou un score – en signaux que le moteur de recherche peut évaluer dans le but de classer les résultats de recherche.

Dans cet article, Searchengineland a compilé 14 facteurs potentiels on-page et off-page que Google pourrait utiliser algorithmiquement pour l’évaluation de l’E-A-T.

Toutefois, je tiens à rappeler que cet article n’est pas censé être une liste exhaustive de tous les signaux E-A-T possibles que Google pourrait utiliser, mais un regard sur certains signaux que Google est le plus susceptible d’utiliser pour évaluer E-A-T, sur la base de preuves à l’appui et de la documentation à notre disposition, dixit Searchengineland.

La plupart des signaux discutés dans cet article sont plus susceptibles d’être influencés par le marketing et les relations publiques. Il n’y a pas de score E-A-T unique dans lequel tous les signaux sont résumés ou additionnés, selon Google. Je peux imaginer que Google obtient une impression générale de l’E-A-T d’un auteur, d’un éditeur ou d’un site Web grâce à de nombreux algorithmes différents.

Cette impression générale n’est pas tant un score, mais une approximation de l’image d’échantillon pour une entité qui a un E-A-T. Google pourrait utiliser des entités d’échantillons sélectionnées pour entraîner les algorithmes à produire un modèle de référence pour E-A-T. Plus l’entité ressemble à cette image de motif à travers différents signaux, plus la qualité est élevée.

1. Qualité globale du contenu du site

E-A-T est une sorte de méta-évaluation d’un éditeur, d’un auteur ou du nom de domaine associé par rapport à un ou plusieurs sujets. En revanche, Google évalue la pertinence au niveau du document (c’est-à-dire chaque contenu individuel par rapport à la requête de recherche respective et à son intention de recherche).

Google évalue donc la qualité d’un éditeur/auteur via E-A-T et la pertinence via des méthodes classiques de recherche d’informations (telles que l’analyse du texte) en combinaison avec des innovations d’apprentissage automatique (telles que Rankbrain).

Dans ce contexte, le contenu de différents domaines peut s’influencer mutuellement de manière positive et négative, comme le confirme Google. Des conseils sur ce à quoi vous devez faire attention afin d’évaluer la qualité du contenu du site Web au total peuvent être trouvés dans les notes sur la mise à jour Google Panda.

2. PageRank ou références à l’auteur / éditeur

Le fait que Google utilise des backlinks et le PageRank hérité d’eux pour évaluer le contenu et les domaines n’est pas nouveau et est confirmé par Google. En outre, le fait que Google utilise des backlinks et du PageRank pour l’évaluation concernant E-A-T est confirmé dans le livre blanc « Comment Google lutte contre la désinformation » :

Les algorithmes de Google identifient les signaux sur les pages qui sont en corrélation avec la fiabilité et l’autorité. Le plus connu de ces signaux est le PageRank, qui utilise des liens sur le Web pour comprendre l’autorité.

 

3. Distance pour faire confiance aux sites d’amorçage dans le profil des liens

La forme la plus avancée du concept de PageRank est basée moins sur le nombre de liens entrants et beaucoup plus sur la proximité des documents liés aux sites Web d’autorité ou de départ.

Le brevet Google de 2017 “Producing a ranking for pages using distances in a web-link graph” décrit comment un score de classement pour les documents liés peut être produit en fonction de la proximité des sites de départ sélectionnés. Dans le processus, les sites de semences eux-mêmes sont pondérés individuellement.

Les sites Web de semences eux-mêmes sont de haute qualité ou les sources ont une grande crédibilité.

Selon le brevet, ces sites Web de semences doivent être sélectionnés manuellement et leur nombre doit être limité pour éviter toute manipulation. La longueur d’un lien entre une page de départ et le document à classer peut être déterminée par les critères suivants :

  • Position du lien.
  • Degré de déviation thématique de la page source.
  • Nombre de liens sortants de la page source.

Il est intéressant de noter que les sites Web qui n’ont pas de lien direct ou indirect vers au moins un site Web de semence ne sont même pas inclus dans la notation. Cela permet également de tirer des conclusions sur les raisons pour lesquelles certains liens sont inclus par Google pour le classement et d’autres pas.

Notez que cependant, toutes les pages de l’ensemble de pages ne reçoivent pas de scores de classement grâce à ce processus. Par exemple, une page qui ne peut être atteinte par aucune des pages de départ ne sera pas classée.

Notez que cependant, toutes les pages de l’ensemble de pages ne reçoivent pas de scores de classement grâce à ce processus. Par exemple, une page qui ne peut être atteinte par aucune des pages de départ ne sera pas classée.

Ce concept peut être appliqué au document lui-même, mais aussi à l’éditeur, au domaine ou à l’auteur en général. Un éditeur ou un auteur qui est souvent directement référencé par les sites de départ obtient une autorité plus élevée pour le sujet et les mots-clés sémantiquement liés à partir desquels il est lié.

Ces sites d’amorçage peuvent être un ensemble de sites par sujet qui sont déterminés manuellement ou qui atteignent un seuil de signaux d’autorité et de confiance.

4. Texte d’ancrage des backlinks

Selon Google, le texte d’ancrage des backlinks n’est pas seulement un signal de classement pour la page cible liée, mais agit également dans la classification thématique de l’ensemble du domaine.

Dans le brevet Google du classement des résultats de recherche basé sur la confiance, il y a aussi des références à l’utilisation du texte d’ancrage comme évaluation de fiabilité.

Dans le brevet Google du classement des résultats de recherche basé sur la confiance, il y a aussi des références à l’utilisation du texte d’ancrage comme évaluation de confiance.

Le brevet décrit comment la notation du classement des documents est complétée sur la base d’une étiquette de confiance. Ces informations peuvent provenir du document lui-même ou de documents tiers référents sous la forme de texte de lien ou d’autres informations relatives au document ou à l’entité. Ces étiquettes sont associées à l’URL et enregistrées dans une base de données d’annotations.

5. Crédibilité ou fiabilité d’un auteur

Dans le passionnant brevet Google “Crédibilité d’un auteur de contenu en ligne”, il est fait référence à divers facteurs qui peuvent être utilisés pour déterminer algorithmiquement la crédibilité d’un auteur. Il décrit comment un moteur de recherche peut classer des documents sous l’influence d’un facteur de crédibilité et d’un score de réputation de l’auteur.

  • Un auteur peut avoir plusieurs scores de réputation, en fonction du nombre de sujets différents sur lesquels il publie du contenu. C’est-à-dire qu’un auteur peut avoir une réputation pour plusieurs sujets.
  • Le score de réputation d’un auteur est indépendant de l’éditeur.
  • Le score de réputation peut être déclassé si des doublons de contenu ou des extraits sont publiés plusieurs fois.

Dans ce brevet, il y a à nouveau une référence aux backlinks – de sorte que le score de réputation d’un auteur peut être influencé par le nombre de liens du contenu publié. Les signaux possibles suivants pour un score de réputation sont mentionnés :

  • Combien de temps l’auteur a fait ses preuves dans la production de contenu dans un domaine thématique.
  • Comment l’auteur est connu.
  • Évaluations du contenu publié par les utilisateurs.
  • Si le contenu de l’auteur est publié par un autre éditeur avec des notes supérieures à la moyenne.
  • Nombre de contenus publiés par l’auteur.
  • Combien de temps s’est écoulé depuis la dernière publication de l’auteur.
  • Les évaluations des publications précédentes sur un sujet similaire par l’auteur.

Autres informations intéressantes sur le score de réputation du brevet :

  • Un auteur peut avoir plusieurs scores de réputation en fonction du nombre de sujets différents sur lesquels il publie du contenu.
  • Le score de réputation d’un auteur est indépendant de l’éditeur.
  • Le score de réputation peut être déclassé si du contenu dupliqué ou des extraits sont publiés plusieurs fois.
  • Le score de réputation peut être influencé par le nombre de liens du contenu publié.

En outre, le brevet traite d’un facteur de crédibilité pour les auteurs. Pour cela, des informations vérifiées sur la profession ou le rôle de l’auteur dans une entreprise sont pertinentes.

La pertinence de la profession par rapport aux sujets du contenu publié est également déterminante pour la crédibilité de l’auteur. Le niveau d’éducation et de formation de l’auteur peut également avoir une incidence à cet égard.

6. Reconnaissance du nom de l’auteur / éditeur (nombre de mentions et volume de recherche)

Plus la popularité d’un auteur/éditeur est élevée, plus il est crédible et plus son autorité dans un domaine d’actualité est élevée. Google peut mesurer algorithmiquement le niveau de notoriété via le nombre de mentions et le volume de recherche du nom.

En plus du brevet déjà mentionné, il existe d’autres déclarations de Google sur le degré de sensibilisation en tant que facteur de classement possible. En ce qui concerne la recherche locale, la déclaration suivante peut être trouvée sur les pages d’aide Google concernant le classement local :

Niveau de sensibilisation : Cela fait référence à la notoriété d’une entreprise. Certains lieux ou choses sont mieux connus que d’autres. Ceci est pris en compte dans le classement des résultats de recherche locale.

Par exemple, les musées célèbres, les hôtels ou les marques de vente au détail qui sont bien connus de nombreux utilisateurs sont également très susceptibles d’apparaître dans une position de premier plan dans les résultats de recherche locaux.

En outre, la sensibilisation ou l’importance découle des informations que nous obtenons sur une entreprise sur le Web – par exemple, via des liens, des articles ou des annuaires.

Gary Illyes de chez Google a parlé à Brighton SEO en 2017 de l’influence des mentions (par exemple dans les réseaux sociaux), et a semblé suggérer que Google pourrait être intéressé par de tels signaux :

Si vous publiez du contenu de haute qualité qui est très cité sur Internet – et je ne parle pas seulement de liens, mais aussi de mentions sur les réseaux sociaux et de personnes parlant de votre image de marque. Alors vous vous en sortez très bien.

 

7. Sentiment autour des mentions ou des évaluations et taux de clics

Google est en mesure d’effectuer une analyse des sentiments via le traitement du langage naturel.

En d’autres termes, le sentiment entourant une entité telle qu’un éditeur ou un auteur peut être déterminé. Si le sentiment est positif, l’auteur/éditeur peut se voir accorder plus de crédibilité. Si c’est négatif, c’est le contraire qui est vrai.

Le brevet de Google sur la détection du sentiment en tant que signal de classement pour les entités révisables décrit comment l’analyse des sentiments peut être utilisée pour identifier le sentiment autour des entités révisables dans les documents. Les résultats peuvent ensuite être utilisés pour classer les entités et les documents associés.

Les entités évaluables comprennent les personnes, les lieux ou les choses à propos desquelles des sentiments peuvent être exprimés, tels que les restaurants, les hôtels, les produits de consommation tels que l’électronique, les films, les livres et les spectacles en direct.

Les données structurées et non structurées peuvent être utilisées comme source. Les avis structurés sont collectés à partir de sites Web d’avis populaires tels que Google Maps, TripAdvisor, Citysearch ou Yelp.

Les données structurées et non structurées peuvent être utilisées comme source. Les avis structurés sont collectés à partir de sites Web d’avis populaires tels que Google Maps, TripAdvisor, Citysearch ou Yelp.

 

Les entités stockées dans la base de données “Sentiment” sont représentées par des “tuples” sous la forme de l’ID d’entité, du type d’entité et d’une ou plusieurs révisions. Les avis se voient attribuer des scores différents, qui sont calculés dans le moteur d’analyse de classement.

Les scores du sentiment concernant les avis respectifs, y compris des informations supplémentaires telles que l’auteur, sont déterminés dans le moteur d’analyse de classement (Ranking Analysis Engine). Le brevet traite également de l’utilisation de signaux d’interaction pour compléter le sentiment en termes de classement en tant que facteur :

  • Score d’interaction utilisateur
  • Score du consensus sur le Sentiment

Comment Google pourrait-il déterminer un score d’interaction utilisateur ? En regardant les signaux utilisateur tels que le CTR (taux de clics) sur les pages de résultats (SERP) et la durée du parcours.

8. Cooccurrences de l’auteur / éditeur avec des termes thématiquement pertinents dans les vidéos, podcasts et documents (off-page)

Les coïncidences d’une entité dans un contenu explorable et interprétable avec des termes de certains domaines pourraient aider Google à classer un auteur ou un éditeur dans un contexte thématique.

Le nombre de cooccurrences ainsi que l’autorité et la fiabilité des sources dans lesquelles les cooccurrences se produisent peuvent être utilisés pour l’évaluation selon E-A-T.

En raison des développements que Google conduit avec des innovations telles que MUM, ce contenu peut également être des images, du contenu vidéo et audio en plus du contenu textuel.

9. Cooccurrences de l’auteur / éditeur avec des termes thématiquement pertinents dans les requêtes de recherche (off-page)

Les cooccurrences d’entités et les termes liés au sujet dans le contenu pourraient aider Google à effectuer une évaluation de l’E-A-T. Les cooccurrences dans les requêtes de recherche peuvent également être un signal important.

Si beaucoup de gens recherchent « mercedes cabrio » ou « olaf kopp content marketing », cela peut indiquer que Mercedes est une autorité sur les cabrios ou qu’Olaf Kopp est une autorité sur le marketing de contenu.

10. Pourcentage de contenu qu’un auteur / éditeur a contribué à un corpus de documents thématiques (on-page / off-page)

Le brevet Google “Systems and Methods for Re-Ranking ranked Search Results” décrit comment les moteurs de recherche peuvent prendre en compte la contribution de l’auteur à un corpus de documents thématiques en plus des liens de contenu de l’auteur.

Ce brevet Google a été déposé en août 2018. Il décrit l’affinement des résultats de recherche en fonction d’une notation de l’auteur, y compris une notation de citation. La notation des citations est basée sur le nombre de références aux documents d’un auteur.
Un autre critère de notation de l’auteur est la proportion de contenu qu’un auteur a contribué à un corpus de documents :

… dans lequel la détermination du score de l’auteur pour une entité respective comprend :

  • la détermination d’un score de citation pour l’entité respective, dans laquelle le score de citation correspond à une fréquence à laquelle le contenu associé à l’entité respective est cité;
  • déterminer un score d’auteur original pour l’entité respective, dans lequel le score d’auteur d’origine correspond à un pourcentage de contenu associé à l’entité respective qui est une première instance du contenu dans un index de contenu connu;
  • et combiner la partition de citation et la partition originale de l’auteur en utilisant une fonction prédéterminée pour produire la partition de l’auteur;

Ce brevet Google a été déposé en août 2018. Il décrit l’affinement des résultats de recherche en fonction d’une notation de l’auteur, y compris une notation de citation.

11. Transparence envers l’auteur / éditeur via les profils d’auteur et les pages “À propos de nous” (On-page)

La transparence à l’égard de l’éditeur ou des auteurs est mentionnée dans les Guidelines sur l’évaluateur de la qualité comme un signal que les évaluateurs de recherche devraient utiliser pour la notation E-A-T.

En outre, les Guidelines pour la crédibilité Web de l’Université de Stanford fournissent quelques conseils sur les questions à traiter lors de la conception d’une page “À propos de nous” et / ou de profils d’auteur.

Montrez qu’il y a une véritable organisation derrière votre site. Montrer que votre site Web est destiné à une organisation légitime renforcera la crédibilité du site.

Le moyen le plus simple de le faire est d’inscrire une adresse physique. D’autres fonctionnalités peuvent également vous aider, telles que la publication d’une photo de vos bureaux ou l’inscription d’un membre à la chambre de commerce.

Mettez en évidence l’expertise de votre organisation et du contenu et des services que vous fournissez. Avez-vous des experts dans votre équipe ? Vos contributeurs ou fournisseurs de services sont-ils des autorités ? Assurez-vous de donner leurs informations d’identification. Êtes-vous affilié à une organisation respectée ? Dites-le clairement.

Inversement, ne créez pas de liens vers des sites externes qui ne sont pas crédibles. Votre site devient moins crédible par association.

Montrez que des personnes honnêtes et dignes de confiance soutiennent votre site. La première partie de cette ligne directrice est de montrer qu’il y a de vraies personnes derrière le site et dans l’organisation. Ensuite, trouvez un moyen de transmettre leur fiabilité à travers des images ou du texte.

Par exemple, certains sites publient des biographies d’employés qui parlent de la famille ou des passe-temps.

En vue de la recherche sémantique ou de la recherche basée sur l’entité, il serait logique que Google inclut les informations collectées sur l’entité, y compris la vérification. Les pages “On parle de nous” et les box d’auteur ne peuvent aider en ce qui concerne E-A-T que si l’éditeur ou l’auteur est une autorité et / ou un expert qui peut être vérifié par Google.

Cet auteur doit avoir déjà laissé des traces explorables sur le web.

12. Liens vers ses propres références

Pour trouver des références qui identifient un éditeur et / ou un auteur en tant qu’autorité et expert, vous pouvez faciliter l’examen de Google en créant des liens vers des publications, des interviews, des profils de conférenciers lors de conférences professionnelles, des articles dans des médias externes, etc., à partir de votre site Web.

13. Utilisation de HTTPS sur le domaine

Google a confirmé que HTTPS est un tout-petit facteur de classement.

En ce qui concerne la confiance (c’est-à-dire la fiabilité d’une source), ce facteur de classement a du sens. Bien que l’influence sur le classement soit plutôt faible, chaque petite fiabilité peut s’additionner.

14. Fiabilité basée sur le Knowledge (entente avec l’opinion et les faits communs)

L’article scientifique “Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources” de Google traite de la détermination algorithmique de la crédibilité des sites Web.

Cet article scientifique traite de la façon de déterminer la fiabilité des sources en ligne. Outre l’analyse des liens, une nouvelle méthode est présentée, basée sur l’examen de l’exactitude des informations publiées.

Nous proposons une nouvelle approche qui repose sur des signaux endogènes, à savoir l’exactitude des informations factuelles fournies par la source. Une source qui a peu de faux faits est considérée comme digne de confiance.

Nous appelons le score de fiabilité que nous avons calculé Knowledge-Based Trust (KBT). Sur des données synthétiques, nous montrons que notre méthode peut calculer de manière fiable les véritables niveaux de fiabilité des sources.

L’évaluation précédente de la crédibilité des sources basées sur les liens et les données du navigateur sur le comportement d’utilisation du site Web présente des faiblesses, car les sources moins populaires ont des cartes pires et sont injustement court-circuitées, même si elles fournissent de très bonnes informations.

En utilisant cette approche, les sources peuvent être évaluées avec un « score de fiabilité » sans inclure le facteur de popularité. Les sites Web qui fournissent fréquemment des informations incorrectes sont dévalués.

Les sites Web qui publient des informations conformes au consensus général sont récompensés. Cela réduit également la probabilité que les sites Web qui attirent l’attention par le biais de fake news gagnent en visibilité sur Google.