Je note

Cet article est noté 4/5 par 15 de nos lecteurs

Référencement, parlons SEO, Acte III : Duplicate Content ou Contenu Dupliqué

Publié6 janvier 2013 Écrit par Nazmi Aydogdu Nb de vues 12001 Commentaires 1

Le contenu dupliqué est pénalisé par Google. Pour éviter cela, prenez connaissance de ce billet.

SEO - le contenu dupliqué - duplicate content

Selon Google, le contenu dupliqué se résume ainsi : « Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ».

Le contenu dupliqué

En clair, plusieurs liens existent pour accéder à un contenu qui lui est unique. C’est une grande négligence qui peut avoir des conséquences désastreuses. Comme le retrait du site des résultats de recherches car considéré comme :

  • site « polluant » ou « non pertinent »,
  • perte de valeur du contenu,
  • perte de PageRank.

www. ou pas ?

Avant de lire ce qui suit, assurez-vous d’avoir consulté les deux premiers volets (PageRank et Contenu) de cette série « Parlons SEO », sinon vous allez vite être perdu.

L’erreur souvent rencontrée sur la toile est l’accès à un site avec le www et sans le www, erreur souvent liée à l’absence de redirection permanente. Nous allons voir les différentes variantes du Duplicate Content et les conséquences que cela aura sur un site.

Explication par l’exemple

Nous allons appeler notre site  » SiteA « .

SiteA est mal conçu et est accessible avec ou sans www. Il n’y a également aucune optimisation SEO et SiteA est également accessible avec ou sans slash. Il y a une tentative d’optimisation du site mais elle a été mal faite donc chaque page à deux liens d’accès :

  1. le lien par défaut de la page,
  2. et le lien réécrit (dans une tentative d’avoir des liens «  »).

Maintenant imaginons que l’on ai envie de consulter la page « À propos » du site en question, voici les liens que Google aura référencé :

  • http://sitea.com/a-propos
  • http://sitea.com/a-propos/
  • http://sitea.com/page-98.html
  • http://sitea.com/page-98.html/
  • http://www.sitea.com/a-propos
  • http://www.sitea.com/a-propos/
  • http://www.sitea.com/page-98.html
  • http://www.sitea.com/page-98.html/

Tous ces liens mènent à une seule et unique page web.

Maintenant imaginons que Google ne fait pas son travail et que toutes ces pages (rappelons qu’il s’agit d’une unique page du site) soient référencées. Voici le résultat obtenu après une recherche avec les mots-clés « siteA à propos » :

Exemple de duplicate content - contenu dupliqué
Exemple de duplicate content – contenu dupliqué

Résultat de cet exemple

Ce n’est vraiment pas terrible. Sans compter la perte de valeur de la page en question, qui par exemple au lieu d’avoir un PageRank de 5 (ce qui est vraiment pas mal pour une page interne), aura un PageRank de… 0 !

💡Et oui, car on divise le PageRank 5 par les 8 liens et non pas par 1 seul lien. 5 / 1 = 5 alors que 5 / 8 c’est déjà beaucoup moins bien.

Bon on a vraiment pris le pire exemple possible, mais même dans le cas d’une duplication www, ça divise une valeur PageRank par 2. Théoriquement, au lieu d’avoir une page d’accueil avec un PR 6 par exemple, on se retrouve avec :

  • la page d’accueil avec le www d’un PR 3,
  • et la même page d’accueil sans le www d’un PR 3.

Le site sera donc moins bien référencé qu’un concurrent qui lui aura un moins bon PR (car moins de backlinks), 4 par exemple, mais aura optimisé son SEO.

Que pense Google du contenu dupliqué ?

Google pénalise les sites possédant du contenu dupliqué car cela impacte négativement la pertinence des résultats de recherche.

Car Google n’aime pas perdre son temps à trier les liens de votre site et décider d’inclure ou pas telle ou telle page. C’est d’ailleurs pour cela qu’une balise nommée « canonical » a été mise en place. Cela minimise l’importance des duplications involontaires. Encore faut-il que cette balise soit correctement utilisée !

L’optimisation du SEO est donc très important et à ne surtout pas négliger pour son référencement.

Qu'est-ce que le Duplicate Content ou Contenu Dupliqué ?

Le « Duplicate Content », ou contenu dupliqué en français, fait référence à des cas où du contenu similaire ou identique apparaît sur plusieurs pages Web à travers l’internet.

 

Quelles sont les conséquences d'un contenu dupliqué ?

Un contenu peut être dupliqué sur votre propre site ou sur le site web d’un concurrent. Dans le deux cas, des pages web dupliquées peuvent être déclassées dans les résultats de recherches.

Discussion

  1. Bon article, je vais ajouter quelques moyens de lutter contre le contenu dupliquer qui est pour la plupart du temps non intentionnel (forum, fiches articles, versions imprimables…)

    1. Indiquer à Google l’URL préférée avec l’option de « canonicalisation »
    2. Agir sur le fichier robots.txt pour interdire des syntaxes d’URL à l’indexation
    3. Utiliser Google Search Console pour vérifier ses titres et méta-descriptions dupliquées.

Je commente

En vous inscrivant à notre newsletter, vous acceptez que vos données soient utilisées comme mentionné dans notre Politique de confidentialité

ALLER EN HAUT Demander un devis