Alors cet article, il vient du coeur. Car j’ai moi même été une victime du duplicate content. Et même si parfois, le duplicate content est involontaire et peut venir de toi, tu verras dans cet article pourquoi il faut absolument le bannir et comment tu peux l’éviter.
Deux fois, très dernièrement, alors que je faisais une recherche sur : les quiz sur les réseaux sociaux et sur la création des affirmations positives (rien à voir avec le Marketing), je me suis retrouvée avec les quatre premiers résultats de recherche sur Google, identiques. Je n’explique pas ma frustration face au contenu dupliqué lorsque je cliquais sur les différents liens et me retrouvais à lire et relire le même article.
Alors oui, je peux comprendre que le « duplicate content » (volontaire) peut être utile : pour les incompétents ou pour les paresseux. Le duplicate content permet de gagner du temps et permet d’éviter de chercher les informations soi-même en reprenant le contenu d’un autre. Mais à part les avantages en gain de temps dans la production de contenu, quel est l’avantage dans le résultat? Et qu’en est-il du duplicate content involontaire, sur ton propre site?
Les articles sur lesquels je suis tombé étaient évidemment positionnés sur les mêmes mots clés. Et si la première fois que j’ai lu l’article, je l’ai trouvé pas mal, j’ai voulu en savoir plus. Alors j’ai cliqué sur le deuxième lien, puis le troisième, puis le quatrième… Tu imagines ma surprise lorsque j’ai remarqué que la seule différence entre ces quatre articles étaient la forme et la mise en page?
Alors cet article est une piqûre de rappel sur le duplicate content et les raisons principales de le bannir.
Le duplicate content est un terme anglais qui se traduit littéralement par « contenu dupliqué ». Ce terme est utilisé pour désigner un contenu similaire ou identique sur deux URL distinctes (volontairement ou non). Source
Le duplicate content peut-être volontaire ou non, dans un même site internet ou entre plusieurs sites.
1. Bannir le duplicate content pour un bon SEO
Pour des raisons très pragmatique, le duplicate content est mal vue par les moteurs de recherche et peut donc nuire directement à ton référencement. En effet, si deux (ou plus) pages avec exactement le même contenu sont référencées pour les mêmes mots clés, les moteurs de recherche ne sauront pas choisir quelle page présenter en premier. Hors, le but premier des moteurs de recherche est de présenter dans ses résultats les contenus les plus pertinents possibles. En guise de « punition », il se peut donc que la page en question se retrouve moins bien référencée ou complètement désindexée.
Mais Cécile, dans ton cas, les pages étaient bien référencées vue que tu nous dis qu’elles sont apparues dans les quatre premiers résultats? Le moteur de recherche n’a donc « puni » aucune des quatre URLs !
C’est exact. Et je ne saurais l’expliquer. Il est possible que les sites ayant partagés cet article sur les quiz sur les réseaux sociaux soient des sites ayant une très bonne autorité, qui passeront au travers des mailles du filet question Search Engine Optimisation. En revanche, lorsque j’ai fait la recherche de nouveau pour pouvoir prendre des captures d’écran et te les montrer sur cet article, les résultats étaient différents. Comme quoi, ça change vite.
En dehors des raisons d’optimisation de référencement dans les résultats de recherche, il y a aussi selon moi un grand problème d’éthique à reproduire du contenu déjà existant à l’identique.
2. Bannir le duplicate content (volontaire) pour protéger sa crédibilité
Parlons morale, parlons éthique, parlons entre professionnel du webmarketing. Si les moteurs de recherche acceptent cette pratique (ou s’ils la tolèrent), moi, je ne l’accepte pas. Et je suis sûre que toi non plus, en tant que lecteur, tu ne l’accepterais pas non plus. Je parle donc ici du duplicate content volontaire : celui dont moi j’ai été victime.
Prenons les deux exemples sur lesquels je suis tombée ce mois-ci. La première fois, je faisais une recherche sur les quiz sur les réseaux sociaux. J’étais à la recherche d’idée pour créer mon propre quiz pour notre audience. J’ai donc cherché « How to make a brand quiz » et parmi les quatre premiers résultats est apparu un article du blog kissmetric, assez connu. J’ai été très déçue de constater que les trois articles suivant étaient identiques. Je peux dire que ces quatre blog ont perdu, à mes yeux, toute crédibilité et toute légitimité. Et si je retombe dessus, je ferais en sorte de les éviter.
En tant que webmarketeur, dans une stratégie de Marketing de Contenu, construire une relation forte avec son audience et installer une relation de confiance n’est-il pas notre but premier? N’avons nous pas envie de donner de la valeur unique à ceux qui nous lisent? Alors, dans ce cas là, n’est-il pas de notre responsabilité de faire en sorte que ce que nous publions sur nos blogs soit exclusif? Et puis aussi, en tant que créateur de contenu, quelle fierté y-a-t-il à reproduire des articles écrits par quelqu’un d’autre? Je tiens à préciser que dans aucun de ces quatre articles je n’ai vu aucun lien faisant référence à l’article d’origine.
3. Se protéger du duplicate content involontaire sur son propre site internet
Pour cette partie, je me base sur l’article fantastique (en anglais) de YOAST qui énonce de façon assez complète les raisons du duplicate contente sur son propre site, comment s’en protéger et comment le fixer. Je me permets de faire un résumé rapide de l’article ici, n’hésite pas à le lire ou à le traduire pour plus d’information.
Les raisons principales du duplicate content intra-site se trouvent souvent dans les configurations et les paramètres de ton site internet. Par exemple, des URLs avec ou sans les www ou le http(s) peuvent être définies pour un unique article. Il est donc possible que tu aies plusieurs URLs pour une même page.
Exemples :
www.monsite.com/blog/mon-article-sur-les-chats
monsite.com/blog/mon-article-sur-les-chats
http://www.monsite.com/blog/mon-article-sur-les-chats
https://www.monsite.com/blog/mon-article-sur-les-chats
Les moteurs de recherche considéreront cela comme du duplicate content. La pagination, le tracking ou les pages de catégories peuvent être d’autres facteurs de créations involontaires d’URLs pour un même article.
Comme présenté dans l’article sur le blog de YOAST, il y a plusieurs façons de résoudre ce type de problème. Il est possible de rediriger les URLs secondaires vers l’URL principale, d’utiliser des liens canoniques ou de mettre un lien vers l’article original. (lire l’article originale pour plus de détails)
4. Repérer le duplicate content
Google Search Console, grâce à son outil d’amélioration de l’HTML permet de lister les pages avec les mêmes titres ou les mêmes méta-description.
Tu peux aussi utiliser, directement dans la barre de recherche des « opérateurs de recherches ». Cela permet de spécifier ta requête et de faire une recherche dans un site en particulier, dans les titres seulement ou parmi les URLs. Pour cela, il suffit de placer, avant la recherche, les « codes » suivant :
- site:
- intitle:
- inurl:
Bon, j’espère que tu en sais maintenant un peu plus sur le duplicate content, ses causes et les moyens de s’en protéger. Maintenant, à toi de jouer.