C\'est quoi le contenu dupliqué pour Google ?

Le contenu dupliqué ou contenu en double est aussi l’un des sujets récurrents du référencement Web abordés par les .

Qu\'est-ce que Google entend par contenu dupliqué ou en double ?

Et ce, en raison du fait qu’il existe différentes sortes de contenus en double dont certains peuvent être pénalisés par et d’autres pas.

Le dernier Hangout de John Mueller sur le “duplicate content”

Par définition, et selon Google, par contenu dupliqué, il entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires. À l\’origine, la plupart de ces contenus ne sont pas malveillants.

Cependant, dans certains cas, le contenu est délibérément dupliqué entre les domaines afin de manipuler le classement du site par les moteurs de recherche ou d\’augmenter le trafic. Ce type de pratique trompeuse peut avoir, selon Google, des effets négatifs sur la navigation de l\’internaute qui voit quasiment le même contenu se répéter dans un ensemble de résultats de recherche.

En conséquence, le référencement du site peut être affecté, ou le site peut être retiré définitivement de l\’index Google, auquel cas il ne s\’affichera plus dans les résultats de recherche.

Alors, voici quelques précisions de John Mueller :

  • Le contenu dupliqué touche à peu près tous les sites web, quelle que soit leur taille.
  • Selon John Mueller, le contenu en double, c’est un même contenu sur un même site. C’est aussi un même contenu avec un même chemin d’accès dans des URLs avec et sans WWW.
  • N’est pas un contenu dupliqué un contenu traduit ou adapté à partir d’une autre langue (ce n’est pas une raison pour ne pas citer la source). Il en est de même avec différentes pages ayant un même titre et/ou une même description, ainsi que le contenu dans les applications.
  • John Mueller confirme ce qu’avait déjà dit Gary Illyes en Mars 2015, à savoir que le contenu dupliqué n’est pas en soi une cause de pénalité.
  • Les contenus dupliqués sont une perte de temps de stockage et de ressources serveurs.
  • Si une page est dupliquée, Google ne conserve qu’une seule copie.
  • Un contenu dupliqué pour 2 localisations dans deux pays différents n’est pas une cause de pénalité.
  • Le contenu dupliqué dans les résultats de recherche crée de la confusion chez les utilisateurs. C’est pourquoi Google ne choisit de n’afficher qu’une seule version, l\’originale.

La pénalité de contenu dupliqué est donc un mythe.

Comment gérer les contenus dupliqués

Selon Google, les mesures suivantes vous permettent de résoudre les problèmes de contenu en double de manière proactive et de vous assurer que les visiteurs accèdent au contenu que vous souhaitez leur présenter.

  • Utilisez les redirections 301 : si vous avez restructuré votre site, utilisez des redirections 301 (\ »RedirectPermanent\ ») dans votre fichier .htaccess pour rediriger efficacement les internautes, Googlebot et les autres robots d\’exploration.
  • Soyez cohérent : soyez cohérent dans votre système de liens internes. Par exemple, n\’établissez pas de lien vers http://www.example.com/page/, http://www.example.com/page ni http://www.example.com/page/index.htm.
  • Utilisez des domaines de premier niveau : pour aider Google à présenter la version la plus appropriée d\’un document, utilisez dans la mesure du possible des domaines de premier niveau pour gérer du contenu spécifique à un pays donné.

    Google peut supposer que le site ”http://www.example.de”, par exemple, présente du contenu destiné à l\’Allemagne, par rapport à “http://www.example.com/de” ou http://de.example.com.

  • Soyez prudent en diffusant votre contenu : si vous publiez votre contenu sur d\’autres sites (Guest blogging), Google affichera systématiquement la version jugée la plus appropriée pour les internautes pour chaque recherche donnée, qui pourra correspondre ou non à celle que vous préférez.

    Cependant, il est utile de s\’assurer que chaque site sur lequel votre contenu est diffusé (notamment en guest blogging) inclut un lien renvoyant vers votre article original.

  • Utilisez Search Console pour indiquer à Google comment indexer votre site : vous pouvez indiquer à Google votre domaine favori (par exemple, http://www.example.com ou http://example.com).
  • Limitez les répétitions : par exemple, au lieu d\’inclure un avis de copyright au bas de chaque page, insérez un bref récapitulatif, puis établissez un lien vers une page plus détaillée. Par ailleurs, vous pouvez utiliser l\’outil de gestion des paramètres pour définir la manière dont Google doit traiter les paramètres d\’URL.
  • Évitez la publication de pages incomplètes : les internautes n\’apprécient pas les pages \ »vides\ », évitez donc les espaces réservés dans la mesure du possible. Utilisez la balise Meta noindex pour bloquer leur indexation.
  • Apprenez à maîtriser votre système de gestion de contenu : vérifiez que vous maîtrisez l\’affichage du contenu sur votre site Web. Les blogs, forums et systèmes associés affichent souvent le même contenu dans des formats divers.
  • Limitez les contenus similaires : si de nombreuses pages de votre site sont similaires, développez chacune d\’entre elles ou regroupez-les pour n\’en faire qu\’une seule.
  • Il n\’est pas recommandé de bloquer l\’accès des robots d\’exploration au contenu en double de votre site Web, que ce soit à l\’aide d\’un fichier robots.txt ou d\’autres méthodes.

    Il est préférable de permettre aux moteurs de recherche d\’explorer ces URL, mais marquez celles-ci comme des doubles à l\’aide de l\’élément link rel=\ »canonical\ », de l\’outil de gestion des paramètres d\’URL ou des redirections 301.

  • Dans le cas où le contenu en double nous conduit à explorer excessivement votre site Web, vous pouvez également régler les paramètres de la vitesse d\’exploration dans Search Console.

En conclusion, sachez que le contenu en double n\’entraîne pas de conséquences négatives particulières pour votre site sauf si l\’objectif semble être de tromper et de manipuler les résultats des moteurs de recherche.

Cependant, si Google estime qu\’il s\’agit de pratiques trompeuses, il retirera votre site de ses pages de résultats de recherche.

Si votre site a été retiré des résultats de recherche, après avoir apporté les modifications nécessaires et vous être assuré que votre site respectait ses consignes SEO, envoyez une demande de réexamen à Google.

Google n\'exécute pas immédiatement l\'attribut rel=canonical

SEO : Google n\'exécute pas immédiatement l\'attribut rel=canonical

Selon Matt Cutts, ceux qui publient des contenus similaires ou dupliqués sur des pages différentes devraient utiliser le tag rel=canonical afin de consolider le PageRank de ces contenus et éviter tout problème avec .

Seulement, voilà. +John Mueller  s\’est à nouveau exprimé sur ce sujet pour laisser entendre que lorsque Google explore une page web, le code rel=\ »canonical\ » n\’est pas immédiatement pris en compte.

Ce qui reviendrait à dire que la page pourrait être indexée telle quelle pendant un certain temps.

Et John Mueller d\’ajouter (vidéo 48:30) que la prise en compte du rel=\ »canonical\ » intervient lors d\’une deuxième ou troisième visite de Googlebot.


Selon John Mueller, Google traite le code rel=canonical comme une simple \ »suggestion\ » et non comme une \ »directive\ ». C\’est pourquoi il se réserve le droit de ne pas l\’accepter et donc de l\’ignorer complètement.

Google procéderait ainsi parce que de très nombreux webmasters qui intègrent l\’attribut canonique dans leurs codes sources, ne l\’installeraient pas correctement puisqu\’ils mentionneraient très souvent le lien de leur Homepage dans le code canonique.

Il faut donc retenir que l\’attribut rel=canonical ne doit pas comporter d\’URL pointant vers la page d\’accueil du site.

Et, de préférence, utilisez les redirection 301 pour les URL non canoniques.

En effet, il est judicieux de choisir parmi vos URL votre URL favorite (canonique) de destination et d\’utiliser des redirections 301 pour envoyer le trafic des autres URL vers l\’URL choisie. Une redirection 301 côté serveur est le meilleur moyen de vous assurer que les internautes et les moteurs de recherche sont redirigés vers la bonne page.

Le code d\’état 301 signifiant que la page a été déplacée de manière définitive vers un autre emplacement.

Quand Google pénalise un site pour publication d\'article hors thématique


Publier un article sur votre blog dans une thématique ne correspondant pas à ce que sait de vous peut-il entraîner des ?

Au regard de ce qui va suivre, il semble que \ »Oui\ », selon Matt Cutts. Explications.

Vous avez peut-être tenté de vous exprimer sur des sujets variés et divers sur votre blog ? Ceci ne serait plus une bonne idée si vous souhaitez bénéficier des faveurs de Google. Car, selon Chris Crum  , vous devez vous focaliser sur ce que vous maîtrisez, donc sur votre domaine de compétence, ou tout du moins dans la thématique que Google reconnaîtrait à votre site.

Surtout si vous pratiquez du guest blogging et acceptez des auteurs invités sur votre blog.

Le Guest Blogging toujours dans le collimateur ?

N\’est-ce pas la preuve de la reconnaissance de votre Autorité et de votre expertise ?

Et pourtant, Google ne semble pas vouloir l\’entendre de cette oreille. Bien au contraire.

C\’est aujourd\’hui un secret de pollichinelle que Google, après les liens factices pénalisés, est actuellement parti en croisade contre le guest blogging. La récente sanction prise à l\’encontre de MyBlogGuest.com  en est le symbole compte tenu de l\’écho retentissant sensé instaurer une nouvelle fois la psychose chez ceux qui le pratiquent.

De plus en plus de sites recevraient des pénalités manuelles pour des posts d\’auteurs invités.

C\’est ainsi que le dénommé SEO Doc Sheldon, qui aurait une bonne réputation , s\’est vu infligé une action manuelle pour avoir accepté de publier sur son blog un guest post que Google a estimé hors sujet par rapport à la thématique attitrée de son blog.

Même si cet article incriminé concernait le marketing, peut-être qu\’il y en avait d\’autres, c\’est celui que Google a pointé du doigt et a sanctionné.

Google imposerait-il des thématiques aux sites ?

Ayant reçu une notification de la part de Google pour \ »vente de lien laissant passer du PageRank ou participation à un réseau de liens…\ », Doc Sheldon a publié une lettre ouverte qu\’il a partagée avec Matt Cutts, Eric Schmidt, Larry Page, Sergey Brin, etc…

C\’est Matt Cutts qui s\’est chargé de répondre dans un tweet en disant ceci : \ »Qu\’est-ce que \ »Bonnes Pratiques pour réseau social hispanique\ » a à faire avec un blog sur la rédaction SEO ? C\’est ce qui justifie l\’action manuelle.\ »

Ce à quoi répond à son tour Doc Sheldon : \ »Mon blog a rapport avec le SEO, le marketing, le social média, le développement web… Il parle de beaucoup de choses. Sinon, je ne l\’aurais pas lancé\ ».

A ce stade, il y aurait comme une forme d\’irrationalité à voir Google tenter d\’imposer une thématique à un site. D\’où le tweet suivant de Doc Sheldon : \ »Devons-nous donc comprendre que juste un lien justifie une pénalité ? Vous envoyez un message pour CELA\ ».

Donc, au final, nous avons deux problèmes en un. Google reproche à Don Sheldon d\’avoir publié un guest post en Mars 2013 en dehors de sa thématique de prédilection, donc un article non approprié, et aussi le suspecte d\’avoir un lien factice à partir de ce même article. Mais, Matt Cutts ne dit pas que l\’article incriminé est de mauvaise qualité. Mais seulement hors thématique.

La réaction de Danny Sullivan

Ulcéré par cette pénalité qui pour lui serait de trop, Danny Sullivan du site Serachengineland.com  a publié à son tour un article pour faire part de sa désapprobation. Il se demande pourquoi Google voudrait-il s\’arroger le droit d\’indiquer aux webmasters sur quelle thématique écrire.

Après avoir estimé dans son article que Google pourrait être en train de sortir de son rôle, Danny Sullivan lui fait les suggestions suivantes :

  • A Google : Assez des pénalités et dirigez-vous vers un modèle où, si vous n\’aimez pas un lien, vous ne le comptez pas, vous ne le pénalisez pas.
  • Aux SEOs et Editeurs : Arrêtez de vous poser des questions sur comment placer des liens, ce qui est actuellement risqué. Pensez à comment développer une vraie audience. Et si les liens arrivent avec cette audience, c\’est tout bénéfice.

La bonne nouvelle pour Doc Sheldon, comme il l\’a confirmé à Danny Sullivan, c\’est que sa pénalité a été levée grâce certainement à la mobilisation de tous ses pairs. Mais, un petit site aurait-il pu bénéficier d\’une levée de pénalité si rapide ?

Quelles leçons tirer de cette affaire ? A vous de le dire…

Voici maintenant comment bien référencer votre site internet sur Google.

Guest Blogging : les sites bénéficiant de liens d\'un réseau peuvent être pénalisés


Matt Cutts avait annoncé il y a 2 jours avoir pénalisé un grand réseau de guest blogging sans indiquer le nom du réseau en question.

Seulement, voilà. Elle a aussi publié

Ce qui a suscité une réponse de Matt Cutts pour clarifier un tant soit peu les choses avec le tweet ci-dessous dans lequel il déclare ceci : \ »Lorsque nous prenons une action contre un réseau de liens spammy, cette action peut inclure les blogs hébergeant des guest posts, les sites bénéficiant des liens de ce réseau, etc\ ».

C\’est d\’ailleurs ce que confirme le tweet ci-dessous d\’une participante au site pénalisé qui prétend avoir perdu des positions sur Google en passant en quelques heures de la première position à la huitième position.

Ce qu\’il faut bien comprendre, c\’est que Google va faire avec les réseaux de guest blogging ce qu\’il fait actuellement avec les réseaux de liens. A savoir, pénaliser des plateformes leaders dans chaque pays afin de marquer les esprits et installer la psychose.

Voici maintenant comment bien référencer votre site internet sur Google.

5 éléments clés dans toute stratégie d\'optimisation web

Pour plus de visibilité internet.

Bien entendu, il existe de nombreuses techniques pour optimiser son site web afin de gagner en visibilité sur qui représente plus de 90% de part de marché de la recherche internet en Europe.

infographie

1. Des Backlinks de qualité

  • Créer du contenu de bonne qualité que les internautes recherchent et voudront partager avec leurs amis.
  • Examiner les backlinks de la concurrence, avec OpensiteExplorer.com par exemple, pour savoir où poser vos liens.
  • Créer sa propre communauté sur les réseaux sociaux autour de votre thématique.
  • Faire du branding en utilisant votre nom de marque ou de site web comme ancre de liens pointant vers vos pages web.

2. Google+ et AuthorShip

  • Pour influencer le pageRank de vos contenus et développer votre propre Autorité.
  • Pour faire afficher votre photo à côté de vos liens présents sur Google et établir une relation de confiance.

3. Url canonique avec rel=\ »canonical\ »

  • Permet de désigner la meilleure adresse web (URL) pour chaque page web.
  • Utile pour éviter parfois des pour contenus dupliqués.
  • Renforce le poids des pages.

4. Microdatas et Schema.org

  • Des attributs basés sur le HTML5 qui indiquent de quoi parle le contenu de la page.
  • Ils améliorent le classement sur Google.

5. Responsive Design

  • Un seul code HTML pour un affichage performant sur PC et sur mobile à la fois.

Voici maintenant comment bien référencer son site sur Google.

Les 5 stratégies indispensables. – source : Act-on.com

Matt Cutts: Rechercher des liens n\'a rien d\'illégal. Tout dépend de la manière…

Matt Cutts et le Link building.

Dans une interview accordée à Eric Enge de Stonetemple, Matt Cutts livre à nouveau son sentiment sur le link building et quelques unes des pratiques qui vont avec.

Comme nous le résume Barry Schwartz

Voici donc ce que pense Matt Cutts de certaines techniques de recherches de liens :

  • Liens provenant des communiqués de presse
  • Contenus éparpillés
  • Liens provenant de Guest Blogging : Trop de gens se trompent encore sur le pourquoi faire du guest blogging. On le pratique de plus en plus comme on ajoute des liens dans des annuaires…
  • Les liens en tant que tels : ils sont toujours le meilleur moyen pour découvrir la pertinence des sites. Et sans doute, au fil du temps, les réseaux sociaux et l\’AuthorShip et d\’autres signaux nous permettront d\’avoir plus d\’informations sur ces liens.

Rechercher des liens n\’a donc rien d\’illégal et ce n\’est pas du tout interdit. Tout dépend de comment vous avez décidé de les obtenir et sur tout à quelle vitesse…

Voici maintenant comment bien référencer son site sur Google en 2014.

Comment Google va calculer l\'AuthorRank de votre profil auteur


se sert de plus en plus de son réseau social Google+ pour influencer les résultats de recherche de son moteur (exemple : Search Plus Your World).

Il est encore temps d\’adhérer à Google AuthorShip

A ce stade, commençons par préciser que Google avait déjà, en Août 2005, déposé un premier brevet dénommé Agent Rank Patent

En plus de Search Plus Your World, une fonctionnalité qui affiche des liens en fonction de vos connections sur Google+, Google AuthorRank va sans doute rebattre les cartes en ce qui concerne les positionnements sur le moteur.

Google AuthorShip va servir à calculer votre AuthorRank

Il est donc temps de commencer lier tous vos contenus à Google AuthorShip, donc à votre profil Google+, afin de développer votre Author Rank pour le moment venu.

statistiques en tant qu\’auteur


Car, vous y verrez les liens, le nombre de clics, le taux de clics et la position moyenne lors de recherches sur Google où apparaissent vos pages crées et connues dans votre AuthorShip, quel que soit le .

Les éléments qui déterminent votre Author Rank

Classement de contenu web généré par les utilisateurs) et publié le 23 août 2012 :

This specification describes techniques for weighting interactions between users in an electronic community and generating user credential scores based on interactions between users. In general, user-generated content items, e.g., comments to a blog or answers posted on a question answering web site, can be analyzed to assign quality factors. The user-generated content items can additionally be analyzed to assess quality of input and identify individual interactions between users (e.g., one or more users uploading responses to a question posed by a first user). The interactions can be represented in a social, or user activity, graph having weightings assigned to directed links between pairs of users based on the assigned quality factors. These weightings and the corresponding interactions can be used to produce user credential scores.

: Cette spécification décrit les techniques de mesure des interactions entre les utilisateurs dans une communauté électronique et la génération de score des utilisateurs au titre de compétences basées sur les interactions entre les utilisateurs. En général, tout contenu généré par un auteur, par exemple, commentaires sur un blog ou réponses affichées sur un site de question-réponse, peut être analysés pour affecter des facteurs de qualité. 


  • Combien de fois un Auteur est cité par les autres auteurs dans leurs articles.
  • Combien de fois un auteur cite les autres auteurs dans ses articles.
  • Nombre total de contenus reliés à un auteur.
  • Nombre de fois un auteur est mentionné par les autres sur les réseaux sociaux.
  • Nombre de liens partagés par un auteur (de lui et des autres).
  • Nombre de fois et à quelle fréquence utilisent-ils des mots clés (avec les hashtags par exemple).
  • Délai de publication entre deux articles et leur éventuelle similarité par rapport à une thématique.
  • Nombre de commentaires du profil entraînant des \ »+1\ » sur Google+.

Découvrez maintenant des conseils de pros pour plus de performances avec Google Plus.