Référencement, parlons SEO, Acte III : Duplicate Content

Mis à jour le7 juillet 2022 Écrit par Nazmi Aydogdu Nb de vues 10953 Commentaires 1
Lecture Zen

Le contenu dupliqué est pénalisé par Google. Pour éviter cela, prenez connaissance de ce billet.

SEO - le contenu dupliqué - duplicate content

Selon Google, le contenu dupliqué se résume ainsi : « Par contenu en double, on entend généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires ».

Le contenu dupliqué

En clair, plusieurs liens existent pour accéder à un contenu qui lui est unique. C’est une grande négligence qui peut avoir des conséquences désastreuses. Comme le retrait du site des résultats de recherches car considéré comme :

  • site « polluant » ou « non pertinent »,
  • perte de valeur du contenu,
  • perte de PageRank.

www. ou pas ?

Avant de lire ce qui suit, assurez-vous d’avoir consulté les deux premiers volets (PageRank et Contenu) de cette série « Parlons SEO », sinon vous allez vite être perdu.

L’erreur souvent rencontrée sur la toile est l’accès à un site avec le www et sans le www, erreur souvent liée à l’absence de redirection permanente. Nous allons voir les différentes variantes du Duplicate Content et les conséquences que cela aura sur un site.

Explication par l’exemple

Nous allons appeler notre site  » SiteA « .

SiteA est mal conçu et est accessible avec ou sans www. Il n’y a également aucune optimisation SEO et SiteA est également accessible avec ou sans slash. Il y a une tentative d’optimisation du site mais elle a été mal faite donc chaque page à deux liens d’accès :

  1. le lien par défaut de la page,
  2. et le lien réécrit (dans une tentative d’avoir des liens «  »).

Maintenant imaginons que l’on ai envie de consulter la page « À propos » du site en question, voici les liens que Google aura référencé :

  • http://sitea.com/a-propos
  • http://sitea.com/a-propos/
  • http://sitea.com/page-98.html
  • http://sitea.com/page-98.html/
  • http://www.sitea.com/a-propos
  • http://www.sitea.com/a-propos/
  • http://www.sitea.com/page-98.html
  • http://www.sitea.com/page-98.html/

Tous ces liens mènent à une seule et unique page web.

Maintenant imaginons que Google ne fait pas son travail et que toutes ces pages (rappelons qu’il s’agit d’une unique page du site) soient référencées. Voici le résultat obtenu après une recherche avec les mots-clés « siteA à propos » :

Exemple de duplicate content - contenu dupliqué

Résultat de cet exemple

C’est vraiment pas terrible. Sans compter la perte de valeur de la page en question, qui par exemple au lieu d’avoir un PageRank de 5 (ce qui est vraiment pas mal pour une page interne), aura un PageRank de… 0 !

💡Et oui, car on divise le PageRank 5 par les 8 liens et non pas par 1 seul lien. 5 / 1 = 5 alors que 5 / 8 c’est déjà beaucoup moins bien.

Bon on a vraiment pris le pire exemple possible, mais même dans le cas d’une duplication www, ça divise une valeur PageRank par 2. Théoriquement, au lieu d’avoir une page d’accueil avec un PR 6 par exemple, on se retrouve avec :

  • la page d’accueil avec le www d’un PR 3,
  • et la même page d’accueil sans le www d’un PR 3.

Le site sera donc moins bien référencé qu’un concurrent qui lui aura un moins bon PR (car moins de backlinks), 4 par exemple, mais aura optimisé son SEO.

Que pense Google du contenu dupliqué ?

Google pénalise les sites possédant du contenu dupliqué car cela impacte négativement la pertinence des résultats de recherche.

Car Google n’aime pas perdre son temps à trier les liens de votre site et décider d’inclure ou pas telle ou telle page. C’est d’ailleurs pour cela qu’une balise nommée « canonical » a été mise en place. Cela minimise l’importance des duplications involontaires. Encore faut-il que cette balise soit correctement utilisée !

L’optimisation du SEO est donc très important et à ne surtout pas négliger pour son référencement.

Aller en haut Contactez-nous X